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内 容 提 要 


本 书 借助 简单 的 Ruby 代码 示例 ， 全 面 、 深 入 地 介绍 计算 理论 和 编程 语言 设计 。 作 者 注重 
实用 性 ， 在 读者 熟知 的 背景 知识 下 ， 以 明晰 的 可 工作 代码 益 释 了 形式 语义 、 自 动机 理论 ， 以 及 
通过 lambda 演算 进行 函数 式 编程 等 计算 问题 ， 并 为 读者 自行 探索 打下 了 良好 基础 。 
本 书面 向 熟悉 某 种 现代 编程 语言 却 非 科班 出 身 的 程序 员 ， 是 一 本 帮 你 真正 理解 计算 机 科学 
和 计算 原理 的 优秀 参考 书 。 
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封面 介绍 


本 书 封面 上 的 动物 是 在 几 (拉丁 学 名 为 Hippopus hippopus)。 碎 蜂 因 其 形状 又 叫 马蹄 蛤 ， 














又 因 其 颜色 泛 红 称 为 草 葡 蛤 。 碎 蜂 是 碎 碟 科 
一 部 分 。 碎 蜂 主 要 生活 在 印度 洋 一 太平 洋 区 





雁 星 有 两 个 相同 而 对 称 的 贸 合 部 。 它 还 有 着 





巨 蛤 亚 科 的 一 部 分 ， 而 碎 碟 科 又 是 乌 蛤 科 的 
成 的 礁石 中 。 





深 深 的 峭 和 与 众 不 同 的 红 白 图 案 。 碎 峰 待 在 

















一 个 地 方 使 用 虹 管 过 滤 周 围 的 水 之 后 ， 以 周 划 








的 浮游 生物 为 食 。 
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D 趾 


= 上 

读者 对 象 

本 书写 给 那些 对 编程 语言 和 计算 理论 充满 好 奇 的 程序 员 ， 特 别 是 没有 正规 学 习 过 数学 或 者 
计算 机 科学 的 朋友 。 

如 果 你 对 涉及 程序 、 语 言 以 及 机 器 ， 且 能 开阔 思维 的 计算 机 科学 知识 感 兴趣 ， 却 被 常常 用 
于 前 明 它 们 的 数学 语言 打击 的 话 ， 那 么 本 书 恰 恰 是 你 需要 的 。 我 们 抛 开 复杂 的 数学 符号 ， 
用 可 工作 的 代码 来 描述 理论 性 概念 ， 并 为 大 家 自行 探索 做 足 准备 。 


























本 书 读者 至 少 要 了 解 一 种 现代 编程 语言 ， 如 Ruby、Python、JavaScript、Java 或 者 C#。 书 
中 所 有 示例 程序 都 采用 Ruby 语言 编写 而 成 ,但 了 解 其 他 语言 的 读者 亦 能 看 懂 。 注 意 ， 本 
书目 标 并 不 是 展示 Ruby 或 面向 对 象 设计 的 最 佳 实践 。 本 书 代 码 意 在 简明 清晰 ， 但 并 不 一 
定 都 容易 维护 ， 因 为 我 们 的 目标 是 使 用 Ruby 阐明 计算 机 科学 ， 而 不 是 用 计算 机 科学 讲解 
Ruby。 本 书 亦 非 教 材 或 者 百科 人 全书， 所 以 并 没有 给 出 形式 论证 或 者 严密 的 证 明 ， 它 试图 让 
尔 能 接近 一 些 有 趣 的 思想 ， 启 发 你 更 深入 地 了 解 它们 。 


排版 约定 


本 书 中 使 用 以 下 排版 约定 。 


。 楷体 
用 于 标记 新 名 词 。 




















。 等 宽 字 体 (constant width) 
用 于 程序 代码 ， 在 段落 中 用 于 表示 程序 的 组 成 部 分 ， 如 变量 或 函数 名 、 数 据 库 、 数 据 
类 型 、 环 境 变 量 、 语 句 、 关 键 字 。 





XI 





。 等 宽 粗 体 (constant width bold) 
命令 或 是 其 他 应 该 由 用 户 输入 的 内 容 。 
。 等 宽 斜 体 (constant width italic) 
应 该 由 用 户 提 供 或 由 上 下 文 确定 的 值 。 
a、 提示 、 建 议 或 一 般 注解 会 放 在 这 里 。 
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使 用 代码 


本 书 旨 在 帮助 读者 解决 实际 问题 。 也 许 你 需要 在 自己 的 程序 或 文档 中 用 到 本 书 中 的 代码 ， 
上 昌 除非 大 段 大 段 地 使 用 ， 否 则 不 必 与 我 们 联系 取得 授权 。 因 此 ， 用 本 书 中 的 几 段 代码 写 个 
程序 不 用 向 我 们 申请 许可 ， 但 是 销售 或 者 分 发 O'Reilly 图 书 随 附 的 代码 光盘 则 必须 事先 获 
得 授权 ， 引 用 书 中 的 代码 来 回答 问题 也 无 需 我 们 授权 ， 而 将 大 段 的 示例 代码 整合 到 自己 的 
产品 文档 中 则 必须 经 过 许可 。 


全 用 我 们 的 代码 时 ， 和 希望 你 能 标明 它 的 出 处 。 出 处 一 般 要 包含 书 名 、 作 者 、 出 版 商 和 书 
号 ， 例 如 : “Understanding Computation by Tom Stuart (O’Reilly). Copyright 2013 Tom Stuart, 
978-1-4493-2927-3”。 
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果 还 有 其 他 使 用 代码 的 情形 需要 与 我 们 沟通 ， 可 以 随时 与 我 们 联系 : permissions@oreilly.com。 
Safari? Books Online 


Safari Books Online (www.safaribooksonline.com) 是 应 需 而 
Safa | 变 的 数字 图 书馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 世界 顶级 
Books Ontine 技术 和 商务 作家 的 专业 作品 。 


Safari Books Online 是 技术 专家 、 软 件 开 发 人 员 、Web 设计 师 、 商 务 人 士 和 创意 人 士 开 展 
调研 、 解 决 上 问题、 学习 和 认证 培训 的 第 一 手 资料 。 




















对 于 组 织 团 体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 的 定 
价 策略 。 用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 OReilly Media、Prentice 
Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit 








Press、 Focal Press、 Cisco Press、John Wiley & Sons、 Syngress、 Morgan Kaufmann、IBM 
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Redbooks、Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、 
Jones && Bartlett、Course Technology 以 及 其 他 儿 十 家 出 版 社 的 上 千 种 图 书 、 培 训 视 频 和 正 
式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信息 ， 我 们 网 上 见 。 


联系 我 们 
请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 
美国 : 

O’Reilly Media, Inc. 


1005 Gravenstein Highway North 
Sebastopol, CA 95472 











中 国 : 
北京 市 西城 区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 
奥 菜 利 技术 咨询 (北京 ) 有 限 公司 


O’Reilly 的 每 一 本 书 都 有 专属 网 页 ， 你 可 以 在 那儿 找到 本 书 的 相关 信息 ， 包 括 勘误 表 、 示 
例 代码 以 及 其 他 信息 。 本 书 的 网 站 地 址 是 : 
http://oreil.ly/Understanding_Computation 























对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮件 到 : 


bookquestions@oreilly.com 





要 了 解 更 多 O'Reilly 图 书 、 培 训 课程 、 会 议和 新 闻 的 信息 ， 请 访问 以 下 网 站 


http://www.oreilly.com 
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刚好 够 用 的 Ruby 基 础 











本 书 中 的 代码 全 部 使 用 Ruby 写成 。Ruby 是 一 种 简单 、 友 好 而 且 有 趣 的 编程 语言 。 因 为 
Ruby 清晰 与 灵活 ， 我 选择 了 它 ， 但 本 书 并 不 依赖 于 Ruby 专 有 的 特性 ， 所 以 这 些 示例 代码 
均 可 转换 成 你 喜欢 的 其 他 任何 语言 ， 特 别 是 像 Python 或 者 JavaScript 这 样 的 动态 语言 ， 如 
果 那 样 你 更 容易 理解 的 话 。 


所 有 的 示例 代码 都 兼容 Ruby 2.0 和 Ruby 1.9。 你 可 以 在 Ruby 官方 站 点 (http://www.ruby- 
lang.org/) 详细 了 解 Ruby， 还 可 以 下 载 一 份 官方 的 实现 。 


我 们 会 快速 浏览 一 下 Ruby 的 特性 ， 并 集中 介绍 本 书 中 用 到 的 部 分 。 如 果 你 想 学 习 更 多 内 
容 ， 推 荐 从 O'Reilly 的 《Ruby 编程 语言 》(The Ruby Programming Language) 一 书 起 步 。 




















和 


ls | 如 果 已 经 了 解 Ruby， 你 完全 可 以 从 第 2 意 开始 阅读 本 


0", 
* 3 
0 


1.1 ”交互 式 Ruby Shell 


Ruby 最 友好 的 一 个 特性 就 是 交互 式 控制 台 IRB， 它 可 以 让 我 们 在 输入 Ruby 代码 后 立即 
看 到 执行 结果 。 本 书 将 广泛 使 用 IRB 与 所 写 的 代码 进行 交互 ， 并 探索 这 些 代码 是 如 何 工 
作 的 。 
在 开发 机 器 的 命令 行 中 输入 irb， 就 可 以 运行 RB 了 。IRB 显示 提示 符 >> 时 ， 表 明 当 前 可 


以 输入 一 个 Ruby 表达 式 。 输 入 一 个 表达 式 并 襄 回 车 键 之 后 ， 代 码 执 行 ， 结 果 会 显示 到 提 
示 符 => 之 后 : 





7 
o 


























$ irb --simple-prompt 
>>1+2 

=> 3 

>> 'hello world' .length 
=> 11 


本 书 中 只 要 出 现 提 示 符 >> 和 =>， 就 是 在 与 IRB 交互 。 为 了 让 长 代码 更 易 读 ， 本 书 显示 它 
们 的 时 候 会 去 掉 提 示 符 ,但 是 仍然 假定 这 些 代码 已 经 输入 或 者 粘贴 进 了 IRB。 所 以 一 旦 本 
书 中 有 像 下 面 这 样 的 Ruby 代码 : 

















x 


y 
z 


[| 
Wu 


X 十 y 




















我 们 之 后 就 可 以 在 IRB 中 得 到 它们 的 结果 : 


>>x*y*z 
=> 30 


1.2 值 


Ruby 是 一 种 面向 表达 式 的 语言 : 每 一 段 有 效 的 代码 执行 之 后 都 要 产生 一 个 值 。 下 面 快速 
浏览 一 下 Ruby 中 不 同类 型 的 值 。 


1.2.1 基本 数据 
如 我 们 所 料 ，Ruby 支持 布尔 型 (Boolean) 、 数 值 型 (number) 和 字符 串 (string)， 且 它们 
都 支持 常规 运算 : 


>> (true && false) || true 
=> true 

>> (3 + 3) * (14 / 2) 

=> 42 

>> 'hello' + ' world' 

=> "hello world" 

>> 'hello world'.slice(6) 
=> "WwW" 


一 个 Ruby 符号 表示 一 个 名 字 ， 是 一 个 轻 量 级 、 不 可 变 的 值 。 作 为 字符 串 的 简单 化 、 非 内 
存 密集 化 (less memory-intensive) 的 替身 ， 符 号 在 Ruby 中 被 广泛 使 用 一 一 通常 是 作为 散 
列表 中 的 键 使 用 (参见 1.2.2 节 )。 符 号 字面 量 的 开头 会 有 一 个 冒号 : 











>> :my_symbol 
=> :my_symbol 


>> :my_symbol == :my_symbol 

=> true 

>> :my_symbol == :another_ symbol 
=> false 
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特殊 值 nil 用 来 表示 不 存在 任何 有 用 的 值 : 


>> “hello world'.slice(11) 
=> nil 


1.2.2 ”数据 结构 
Ruby 的 数组 字面 量 是 一 串 用 逗号 分 隔 的 值 外 加 方 括 号 的 形式 : 


>> numbers = ['zero', 'one', 'two'] 
=> ["zero", "one", "two"] 
>> numbers[1] 


>> numbers.push('three', 'four') 

=> ["zero", "one", "two", "three", "four"] 
>> numbers 

=> ["zero", "one", "two", "three", "four"] 
>> numbers.drop(2) 

=> ["two", "three", "four"] 





范围 (range) 表示 最 小 值 和 最 大 值 之 间 值 的 集合 。 范 围 的 写法 是 在 两 个 值 之 间 加 两 个 点 : 


>> ages = 18..30 

=> 18..30 

>> ages.entTies 

=> [18，19，20，21，22，23，24，25，26，27，28，29，30] 
>> ages.include?(25) 

=> true 

>> ages.include?(33) 

=> false 


一 个 散 列 (hash) 表示 一 个 集合 ， 其 中 每 个 值 都 与 一 个 键 相关 联 ， 一 些 编程 语言 把 这 种 数 
据 结 构 叫 作 “ 上 映射 ”(map)、“ 字 典 ”(dictionary) 或 者 “关联 数组 ”(associative array)。 
一 个 散 列 字面 量 写 成 大 括号 里 用 逗号 分 隔 的 “ 键 => 值 ”对 的 列表 : 














>> fruit = { 'a' => 'apple', 'b' => 'banana', 'c' => 'coconut' } 
=> {"a"=>"apple", "b"=>"banana", "c"=>"coconut"} 

>> fruit['b'] 

=> "banana" 

>> fruit['d'] = 'date’ 

=> "date" 

>> fruit 

=> {"a"=>"apple", "b"=>"banana", 


Wn 


c"=>"coconut", "d"=>"date"} 


散 列 经 常 将 符号 用 作 键 ， 所 以 键 作为 符号 时 ，Ruby 提供 了 另 一 种 书写 键 值 对 的 语法 。 这 种 
写法 比 “ 键 => 值 ”的 方式 更 为 紧凑 ,而 且 看 起 来 很 像 常用 于 JavaScript 对 象 的 JSON 格式 : 

















>> dimensions = { width: 1000, height: 2250, depth: 250 } 
=> {:width=>1000,，:height=>2250，:depth=>250} 

>> dimensions[:depth] 

=> 250 





刚好 够 用 的 Ruby 基 础 | 3 


1.2.3 proc 


一 个 proc 是 一 段 未 经 求 值 的 Ruby 代码 ， 根 据 需 要 进行 传递 和 求 值 ; 


其 他 语言 把 这 种 语言 














结构 称 为 “匿名 函数 ”或 “lambda 函数 ”。proc 字 男 





i 量 有 多 种 写法 ， 











其 中 最 紧凑 的 一 种 是 








“-> 参数 { 函数 体 }” 语 法 : 


>> 
=> 


multiply = -> x, y {x*y} 
#<Proc (lambda)> 
multiply.call(6, 9) 

54 

multiply.call(2, 3) 

=> 6 


=> 


除了 .call 语法 ， 还 可 以 使 用 方 括号 调用 proc: 


>> multiply[3, 4] 
=> 12 


1.3 控制 流 


Ruby 有 if、case 和 while 表达 式 ， 它 们 都 以 通常 的 方式 工作 : 


>> if2<3 
"less 
else 
“more 
end 
"less" 
quantify = 
-> number { 
case number 
when 1 
"one” 
when 2 
'a _ couple" 
else 
many 
end 
} 
#<Proc (lambda)> 
quantify.call(2) 
"a couple" 
quantify.call(10) 
"many" 
X = 1 
=> 1 
while x < 1000 
二 :这 
end 
nil 
>> x 
1024 


>> 
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1.4 ”对象 和 方法 


Ruby 看 起 来 和 其 他 动态 编程 语言 很 像 ， 但 有 一 个 重要 的 区 别 : 每 个 值 都 是 一 个 对 象 ， 而 
且 对 象 彼此 之 间 靠 发 送 消息 进行 通信 '。 每 个 对 象 都 有 自己 的 方法 集合 ， 这 些 方法 决定 了 
它 如 何 响应 特定 的 消息 。 

一 个 消息 有 一 个 名 字 ， 并 且 根 据 需 要 可 以 有 一 些 参 数 。 一 个 对 象 收 到 一 个 消息 的 时 候 ， 它 
对 应 的 方法 就 会 使 用 消息 中 的 参数 作为 自己 的 参数 执行 。 这 就 是 Ruby 完成 全 部 工作 的 方 
式 ; 甚至 “1+2” 都 意味 着 “使 用 参数 2 给 对 象 1 发送 一 个 叫 作 + 的 消息 ”， 而 对 象 1 有 一 
个 处 理 那个 消息 的 方法 村 。 


我 们 可 以 使 用 关键 字 def 定义 自己 的 方法 : 

















>> 0 = Object.new 
=> #<0bject> 
>> def o.add(x, y) 
x+y 

end 
=> nil 
>> 0.add(2, 3) 
=> 5 





这 里 ， 我 们 通过 向 一 个 特殊 内 建 对 象 0bject 发 送 new 消息 来 新 建 一 个 对 象 ， 新 对 象 创建 之 
后 ， 在 其 上 定义 了 一 个 叫 #add 的 方法 。#add 方法 把 它 的 两 个 参数 加 在 一 起 ， 并 返回 结果 ， 
因为 一 个 方法 中 最 后 执行 的 表达 式 的 值 将 被 自动 返回 ， 所 以 并 不 需要 一 个 显 式 的 return。 
在 使 用 2 和 3 作为 参数 向 那个 对 象 发 送 add 消息 之 后 ，#add 方法 就 会 执行 ， 然 后 我 们 就 得 
到 了 想 要 的 结果 。 


通常 情况 下 ， 在 发 送 消息 时 要 写 上 接收 对 象 和 消息 名 并 用 圆 点 分 阳 (例如 0.add)， 但 是 
Ruby 会 一 直 追 踪 当 前 对 象 ( 叫 作 self)， 这 样 在 向 当前 对 象 发 送 消息 时 只 需 写 上 一 个 消息 
名 ， 接 收 对 象 可 以 不 必 显 式 写 出 来 。 例 如 ， 在 一 个 方法 定义 内 部 ， 当 前 对 象 总 是 接收 消息 
并 执行 此 方法 的 对 象 ， 因 此 在 一 个 特定 对 象 的 方法 内 部 ， 向 同一 个 对 象 发 送 其 他 消息 时 ， 
可 以 不 必 显 式 提 及 : 
































>> def o.add twice(x，y) 
add(x, y) + add(x, y) 
end 
=> nil 
>> 0.add twice(2, 3) 
=> 10 


注意 ， 我 们 在 #add_twice 方法 里 给 o 发 送 add 消息 时 ， 可 以 不 人 必 写 成 0.add(x，y)， 只 写 





注 1: 这 种 来 自 于 编程 语言 Smalltalk 的 风格 ， 对 Ruby 的 设计 有 直接 影响 。 
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add(x,y) 就 可 以 ， 这 是 因为 o 是 接收 add_twice 消息 的 对 象 。 








在 所 有 的 方法 定义 之 外 ， 当 前 对 象 是 一 个 叫 main 的 特殊 顶层 对 象 ， 任 何 没 有 指明 接收 者 的 
消息 都 会 被 发 送 给 它 ， 同 样 ， 任 何 没 有 指明 对 象 的 方法 定义 都 可 以 通过 main 使 用 : 








>> def multiply(a, b) 
a*b 
end 
si 
>> multiply(2, 3) 
=> 6 


1.5 “类 和 模块 

能 在 许多 对 象 之 间 共 享 方法 定义 是 件 很 便利 的 事 。 在 Ruby 中 我 们 可 以 把 方法 定义 放 到 一 
个 类 里 ， 然 后 通过 给 那个 类 发 送 new 消息 来 新 建 对 象 。 所 获得 的 对 象 是 包括 方法 在 内 的 这 
个 类 的 实例 。 例 如 : 








>> class Calculator 
def divide(x, y) 


=> nil 

>> c = Calculator.new 
=> #<Calculator> 

>> c.class 

=> Calculator 

>> c.divide(10, 2) 
=>5 


注意 ， 在 一 个 类 定义 里 定义 一 个 方法 会 把 方法 添加 到 那个 类 的 实例 里 ， 而 不 是 加 到 main 里 : 


>> divide(10，2) 
NoMethodError: undefined method ‘divide' for main:0bject 


一 个 类 可 以 通过 继承 来 引入 另 一 个 类 的 方法 定义 : 


>> class MultiplyingCalculator < Calculator 
def multiply(x, y) 
x*y 
end 
end 
=> nil 
>> mc = MultiplyingCalculator.new 
=> #<MultiplyingCalculator> 
>> mc.class 
=> MultiplyingCalculator 
>> mc.class.superclass 
=> Calculator 
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>> mc.multiply(10, 2) 
=> 20 

>> mc.divide(10, 2) 
=> 5 


子 类 中 的 方法 可 以 通过 super 关键 字 调 用 超 类 的 同名 方法 : 





>> class BinaryMultiplyingCalculator < MultiplyingCalculator 
def multiply(x, y) 
result = super(x, y) 
result.to_s(2) 
end 
end 
=> nil 
>> bmc = BinaryMultiplyingCalculator.new 
=> #<BinaryMultiplyingCalculator> 
>> bmc.multiply(10, 2) 
=> "10100" 


另 一 种 共享 方法 定义 的 方式 是 在 模块 module) 中 声明 它们 ， 这 样 它们 就 能 被 任意 类 包括 
进去 : 





>> module Addition 
def add(x, y) 
x+y 
end 
end 
=> nil 
>> class AddingCalculator 
include Addition 
end 
=> AddingCalculator 
>> ac = AddingCalculator.new 
=> #<AddingCalculator> 
>> ac.add(10, 2) 
= 2 


1.6 ”其 他 特性 


下 面 是 本 书 中 示例 代码 会 用 到 的 其 他 特性 。 

















1.6.1 局 部 变量 和 赋值 
就 像 我 们 已 经 看 到 的 那样 ，Ruby 仅 允 许 通过 赋值 声 明 局 部 变量 ， 





>> greeting = 'hello' 
=> "hello" 

>> greeting 

=> "hello" 
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我 们 还 可 以 通过 数组 一 次 给 多 个 变量 并 行 赋值 : 





>> width, height, depth = [1000, 2250,250] 
=> [1000，2250，250] 

>> height 

=> 2250 


1.6.2 ”字符 串 插值 
字符 串 可 以 使 用 单 引 号 也 可 以 使 用 双 引 号 表示 。 对 双 引 号 中 的 字符 串 ，Ruby 会 自动 用 表 
达 式 的 结果 替换 #{ 表达 式 }， 以 执行 字符 串 插值 操作 。 




















>> "hello #{'dlrow' .reverse}" 
=> "hello world" 


如 果 被 插入 的 表达 式 返回 的 不 是 一 个 字符 串 类 型 的 对 象 ， 那 么 这 个 对 象 就 会 自动 收 到 一 个 
to_s 消息 以 返回 能 顶 禁 其 位 置 的 字符 串 。 我 们 可 以 借 此 控制 被 替换 对 象 的 展示 方式 : 




















>> 0 = 0bject.new 
=> #<0bject> 
>> def o.to s 
'a new object" 

end 
=> nil 
>> "here is #{0}" 
=> "here is a new object" 


1.6.3 ”检查 对 象 


| 


每 











当 IRB 需要 显示 一 个 对 象 ， 类 似 下 面 的 一 些 事情 就 会 发 生 : 向 这 个 对 象 发 送 inspect 消 

















息 ， 然 后 这 个 对 象 返回 自身 的 字符 串 表 示 。Ruby 当中 所 有 对 象 默 认 都 有 对 村 nspect 的 合 














理 实 现 ， 但 是 通过 提供 自己 的 定义 ， 我 们 就 可 以 控制 如 何在 控制 台 显示 对 象 : 


>> 0 = 0bject.new 

=> #<0bject> 

>> def o.inspect 

'[my object]' 

end 

=> nil 

>> 0 

=> [my object] 


1.6.4 打印 字符 串 
方法 #puts 对 每 个 Ruby 对 象 (包括 main) 都 可 用 ， 可 以 用 来 向 标准 输出 打印 字符 串 : 





>> x = 128 
=> 128 
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>> while x < 1000 
puts "x is #{x}" 
X=X*2 

end 

x is 128 

x is 256 

x is 512 

=> nil 


1.6.5 ”可 变 参 数 方 法 (variadic method) 
定义 方法 时 可 以 使 用 * 运算 符 ， 以 支持 数目 可 变 的 参数 ， 


>> def join with commas(*words) 
words.join(', ') 
end 
=> nil 
>> join with commas('one', 'two', 'three') 
=> "one, two, three" 





一 个 方法 定义 只 能 有 一 个 可 变 参 数 ， 而 常规 参数 放 到 可 变 参 数 的 前 后 都 可 以 : 


>> def join with commas(before, *words, after) 
before + words.join(', ') + after 
end 
=> nil 
>> join with commas('Testing: 
=> "Testing: one, two, three." 


， "one'， 'two', 'three', '.') 


在 发 送 消息 的 时 候 ，* 运算 符 还 可 以 把 每 一 个 数组 元 素 当 作 单 个 参数 处 理 : 





>> arguments = ['Testing: ', 'one', 'two', 'three'’, '.'] 
=> ["Testing: ", "one", "two", "three", "."] 

>> join with commas(*arguments) 

=> "Testing: one, two, three." 


* 也 可 以 使 用 并 行 赋值 方式 : 
>> before, *words, after = ['Testing: ', 'one', 'two', 'three'’, '.'] 
=> ["Testing: ", "one", "two", "three", "."] 
>> before 
=> "Testing: " 
>> words 
=> ["one", "two", "three"] 
>> after 


nn 


1.6.6 ”代码 块 
代码 块 (block) 是 由 do/end 或 者 大 括号 围 住 的 一 段 Ruby 代码 。 方 法 可 以 带 一 个 隐 式 代码 
块 参数 ， 并 使 用 yield 关键 字 表示 对 代码 块 中 那 段 代码 的 调用 : 
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>> def do three _ times 
yield 
yield 
yield 
end 
=> nil 
>> do_three times { puts 'hello' } 
hello 
hello 
hello 
=> nil 


代码 块 可 以 带 参数 : 


>> def do three times 
yield('first') 
yield('second') 
yield('third') 

end 

= iL 

>> do three times { |n| puts "#{n}: hello" } 

first: hello 

second: hello 

third: hello 

= ML 


yield 返回 执行 代码 块 的 结果 : 


>> def number_ names 
[yield('one'), yield('two'), yield('three')].join(', ') 
end 
=> nil 
>> number names { |name| name.upcase.reverse } 
=> "ENO, OWT, EERHT" 


1.6.7” 枚 举 类 型 

Ruby 有 一 个 叫 作 Enumerable 的 内 置 模块 ， 被 数组 (Array)、 散 列表 (Hash)、 范 围 
(Range) 以 及 其 他 表示 值 的 集合 的 类 包含 。Enumerable 提供 的 方法 可 以 帮助 我 们 对 集合 进 
行 遍历 、 搜 索 和 排序 ， 其 中 的 很 多 方法 在 调用 时 都 可 以 带 上 一 个 代码 块 。 通 常 ， 代 码 块 
中 的 代码 会 根据 集合 中 的 一 些 值 或 全 部 值 来 运行 ， 以 此 承担 方法 的 一 部 分 工作 。 例 如 : 

















>> (1..10).count { |number| number.even? } 
=> 5 

>> (1..10).select { |number| number.even? } 
= [2， 4，6，8， 10] 

>> (1..10).any? { |number| number < 8 } 

=> true 

>> (1..10).all? { |number| number < 8 } 

=> false 

>> (1..5).each do |number| 
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if number.even? 
puts "#{number} is even" 
else 
puts "#{number} is odd" 
end 
end 
is odd 


=> 1..5 
>> (1..10).map { |number| number * 3 } 
3 [3, 6 9, 12, 15,. 18, 21, 24, 27, 30] 


通常 ， 一 个 代码 块 带 有 一 个 参数 ， 并 向 此 参数 发 送 一 个 无 参 的 消息 ， 所 以 Ruby 提供 了 一 
种 缩写 方式 8:message， 这 比 写 代码 块 { |object| object.message } 更 为 简洁 : 

>> (1..10).select(&:even?) 

= [2， 4，6，8， 10] 

>> ['one', 'two', 'three'].map(&:upcase) 

=> ["ONE", "TWO", "THREE"] 
有 的 代码 块 可 以 为 集合 中 的 每 个 值 生成 一 个 数组 ，Enumerable 的 方法 #flat_map 能 把 这 些 
生成 的 结果 数组 连接 起 来 : 

>> ['one', 'two', 'three'].map(&:chars) 

=> [["o", 3 "e"], LE "WwW", “ol; [ts "hs 中 和 人 "e"]] 

>> ['one', 'two', 'three'].flat map(&:chars) 

=> ["o", "nn", Re 机 "Ww", ol SS "he "3 ey “ee 
还 有 一 个 有 用 的 方法 村 nject。 有 些 代 码 块 会 处 理 集 合 中 的 每 个 值 ， 相 nject 能 对 这 个 代码 
块 求 值 并 累积 成 一 个 最 终结 果 : 

>> (1..10).inject(0) { |result, number| result + number } 

=> 55 

>> (1..10).inject(1) { |result, number| result * number } 

=> 3628800 


>> ['one', 'two', 'three'].inject('Words:') { |result, word| "#{result} #{word}"” } 
=> "Words: one two three" 


1.6.8 结构 体 


结构 体 (Struct) 是 Ruby 中 一 个 特殊 的 类 ， 它 的 工作 是 生成 其 他 类 。 根 据 传 进 Struct. 
new 的 每 个 属性 名 ，Struct 产 成 的 类 会 包含 相应 的 获取 方法 和 设置 方法 。 要 使 用 由 结构 体 
生成 的 类 ， 常 见方 式 是 对 其 进行 子 类 化 ， 我 们 可 以 给 子 类 起 个 名 字 ， 然 后 在 里 边 定义 其 他 
任意 的 方法 。 例如， 为 了 创建 一 个 拥有 属性 x 和 y， 名 字 是 Point 的 类 ， 可 以 写成 : 




















class Point < Struct.new(:x, :y) 
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def +(other point) 
Point.new(x + other point.x, y + other point.y) 
end 


def inspect 
"#<Point (#{x}, #{y})>" 
end 
end 


现在 我 们 可 以 创建 Point 的 一 些 实例 ， 然 后 在 IRB 中 进行 检查 ， 并 给 它们 发 送 消 息 : 


和 我 们 定义 的 所 有 方法 一 样 ，Point 实例 会 响应 消息 x 和 x=， 以 便 获 取 和 设置 属性 x 的 f 


>> a = Point.new(2, 3) 
=> #<Point (2, 3)> 

>> b = Point.new(10, 20) 
=> #<Point (10, 20)> 

>> at+b 

=> #<Point (12, 23)> 


TI 














y 和 y= 与 x 和 x= 的 情况 类 似 : 


>> a.X 

=> 2 

>> a.X = 35 

=> 35 

>a+b 

=> #<Point (45, 23)> 


由 Struct.new 生成 的 类 还 有 其 他 实用 功能 ， 像 判断 是 否 相等 的 方法 #= 的 实现 ， 就 可 以 比 
较 两 个 结构 体 的 属性 是 否 相等 : 


>> Point.new(4, 5) == Point.new(4, 5) 
=> true 
>> Point.new(4, 5) == Point.new(6, 7) 
=> false 


1.6.9 给 内 置 对 象 扩展 方法 〈Monkey Patching) 
我 们 随时 都 可 以 给 类 或 模块 增加 方法 。 这 是 一 个 强大 的 特性 ， 通 常 叫 作 Monkey Patching， 
可 以 让 我 们 扩展 已 有 类 的 行为 : 


>> class Point 

def -(other point) 

Point.new(x - other point.x, y - other point.y) 
end 
end 

=> nil 
>> Point.new(10, 15) - Point.new(1, 1) 
=> #<Point (9, 14)> 





我 们 甚至 可 以 扩展 Ruby 内 置 的 类 : 


>> class String 

def shout 

upcase + "1!!' 
end 
end 

=> nil 
>> 'hello world' .shout 
=> "HELLO WORLD!I!!" 


1.6.10 ”定义 常量 
Ruby 支持 一 种 叫 作 常 量 的 特殊 变量 。 一 般 而 言 ， 常 草 











旦 创建 ， 就 不 能 再 被 重新 赋值 。 


(Ruby 并 不 会 阻止 一 个 常量 被 重新 赋值 ， 但 它 会 产生 警告 ， 以 便 我 们 知道 自己 做 错 了 事 。) 
任何 以 大 写字 母 开头 的 变量 都 是 常量 。 可 以 在 顶层 或 者 在 一 个 类 或 模块 中 定义 新 的 常量 : 








>> NUMBERS = [4，8，15，16，23，42] 

= [4， 8，15，16，23， 42] 

>> class Greetings 
ENGLISH = "hello' 
FRENCH = "bonjour' 
GERMAN = 'guten Tag' 

end 

=> "guten Tag" 

>> NUMBERS. 1last 

=> 42 

>> Greetings: :FRENCH 

=> "bonjour" 


类 和 模块 的 名 字 总 是 以 大 写字 母 开 头 ， 所 以 类 和 模块 的 名 字 也 是 常量 。 


1.6.11 删除 常量 





在 使 用 IRB 进行 探索 时 ， 如 果 我 们 想 重新 定义 某 个 类 或 模块 ， 而 不 是 要 扩展 它们 ， 实 用 的 


做 法 是 让 Ruby 完全 忽略 该 常量 。 一 个 顶层 常量 可 以 通过 给 0bject 发 送 消息 remove_const 


来 删除 ， 同 时 还 要 把 常量 名 作为 符号 (symbol) 对 象 传 进 去 : 


>> NUMBERS.1ast 

=> 42 

>> Object.send(:remove const, :NUMBERS) 
=> [4, 8, 15, 16, 23,42] 

>> NUMBERS. last 

NameError: uninitialized constant NUMBERS 
>> Greetings: :GERMAN 

=> "guten Tag" 

>> Object.send(:remove_const, :Greetings) 
=> Greetings 

>> Greetings: :GERMAN 
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NameError: uninitialized constant Greetings 

















只 能 使 用 0bject.send(:remove_const，: 常量 名 ) 而 非 0bject.remove_const(: 常量 名 )， 
这 是 因为 remove_const 是 一 个 私有 人 方法 ， 只 能 通过 从 Object 类 的 自身 内 部 发 送 
消息 来 调用 ， 使 用 0bject.send 时 ,我们 可 以 暂时 跳 过 这 个 限制 。 
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第 一 部 分 


程序 和 机 器 

















什么 是 计算 ?这 个 词 对 于 不 同人 来 说 意思 不 同 ， 但 是 每 个 人 都 会 赞同 这 样 一 种 理解 ， 在 一 
台 计 算 机 读 取 程序 、 运 行程 序 、 读 入 一 些 输入 ， 并 且 最 后 产生 一 些 输出 的 时 候 ， 肯 定 发 生 
了 某 种 计算 。 因 此 我 们 可 以 这 样 认为 : 计算 就 是 指 计算 机 所 做 的 事情 。 














为 了 创造 一 个 环境 让 这 种 熟悉 的 计算 发 生 ， 需 要 三 个 基本 要 素 : 

。 一 台 机 器 ， 能 够 执行 计算 ; 

。 一 种 语言 ， 用 来 编写 这 人 台 机 器 能 够 理解 的 指令 ; 

。 一 个 程序 ， 用 这 种 语言 编写 ， 描 述 机 器 应 该 具体 执行 哪些 计算 。 





这 部 分 内 容 就 是 关于 机 器 、 语 言 和 程序 的 : 它们 是 什么 ， 行 为 如 何 ， 我 们 如 何 对 其 建 模 并 
展开 研究 ， 以 及 如 何 利用 它们 完成 实际 工作 。 通 过 研究 这 三 要 素 ， 我 们 将 对 计算 的 含义 以 
及 它 是 如 何 发 生 的 有 更 好 的 理解 。 





在 第 2 章 ， 我们 将 设计 和 实现 一 种 简单 的 编程 语言 ， 并 用 儿 种 不 同 的 方法 来 研究 这 种 语言 
的 含义 。 理 解 了 一 种 语言 的 含义 ， 就 可 以 把 一 段 没有 生命 的 源 代码 和 一 个 动态 的 、 正 在 执 
行 的 进程 联系 起 来 。 每 一 种 方法 都 能 带 给 我 们 一 个 把 程序 运行 起 来 的 特定 策略 ， 而 我 们 最 
终 将 用 几 种 不 同 的 方式 来 实现 同一 语言 。 











我 们 会 发 现 编程 是 一 门 把 一 个 准确 定义 的 结构 组 装 起 来 的 艺术 ， 这 个 结构 能 拆卸 、 分 析 ， 
并 最 终 被 一 台 机 器 解释 执行 从 而 完成 一 次 计算 。 更 重要 的 是 ， 我 们 还 会 发 现实 现 编程 语言 
既 简 单 又 有 趣 : 尽管 语法 分 析 、 解 释 和 编译 看 起 来 很 个 人 ， 但 实际 摆弄 起 来 其 实 会 感觉 简 
单 又 愉快 。 





如 果 没 有 机 器 来 运行 ， 程 序 本 身 没 有 多 大 用 处 。 所 以 在 第 3 章 里 ， 我 们 会 设计 非常 简单 的 
机 器 ， 以 便 执 行 基本 的 、 硬 编码 的 任务 。 有 了 这 个 简单 的 基础 ， 我 们 在 第 4 章 会 向 更 复杂 
的 机 器 努力 前 进 ， 并 在 第 5 章 介 绍 如 何 设 计 能 被 软件 控制 的 通用 计算 装置 。 





到 第 二 部 分 的 时 候 ， 我 们 将 了 解 拥有 计算 能 力 的 机 器 的 全 景 : 一 些 机 器 拥有 非常 有 限 的 能 
力 ， 一 些 机 器 用 处 更 大 但 仍然 令 人 诅 形 地 有 一 些 限制 ， 最 后 还 有 一 些 机 器 是 我 们 知道 如 何 
构建 的 最 强大 的 机 器 。 
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程序 的 含义 





不 准 想 ， 快 点 ! 就 像 直觉 地 把 手指 向 月 亮 。 记 住 ， 反应 慢 了 就 只 能 看 到 手指 ， 而 
绝 不 能 看 到 月 亮 的 光华 了 。 
一 一 电影 《龙争虎斗 》， 李 小 龙 


编程 语言 ， 以 及 我 们 用 编程 语言 所 写 的 程序 ， 这 些 都 是 软件 工程 师 工 作 的 基础 。 我 们 用 编 
程 语言 和 程序 阐明 复杂 的 想法 ， 并 在 彼此 之 间 交 流 这 些 想法 ， 当 然 最 重要 的 是 在 计算 机 中 
实现 这 些 想 法 。 就 像 人 类 社会 没有 自然 语言 就 难以 运转 一 样 ， 全 球 的 程序 员 都 依赖 编程 语 
言传 递 和 实现 自己 的 想法 ， 每 一 个 有 成 效 的 程序 都 是 实现 更 高 层 思想 的 基础 。 














程序 员 是 注重 实际 的 生物 。 程 序 员 经 常 通过 阅读 文档 、 学 习 教 程 、 研 究 现 有 的 程序 以 及 修 
改 自 己 的 简单 程序 来 学 习 新 的 编程 语言 ， 而 不 会 过 多 地 思考 那些 程序 有 什么 含义 。 有 时 
候 ， 学 习 的 过 程 就 像 试 错 : 我 们 试图 通过 看 例子 和 文档 来 理解 一 个 语言 片段 ， 然 后 会 努力 
用 这 种 语言 写 点 什么 ， 之 后 所 有 问题 就 都 爆发 了 ， 而 我 们 只 得 回头 重 试 ， 直 到 成 功 组 装 了 
一 个 大 部 分 情况 下 都 能 工作 的 东西 。 随 着 程序 支持 的 计算 机 和 系统 越 来 越 复杂 ， 它 们 很 容 
易 被 看 成 是 一 些 难 懂 的 符 响 ， 这 些 符 响 只 代表 它们 自己 而 看 不 出 有 什么 含义 ， 并且 它们 只 
是 偶尔 才能 正常 工作 。 


但 是 计算 机 编程 不 单 是 与 右 序 相关 ， 重 要 的 是 程序 员 要 表达 的 思想 。 程 序 只 是 思想 的 静态 
表示 ， 是 曾经 存在 二 程序 员 脑 海中 的 某 个 结构 的 快照 。 程 序 是 因为 有 了 含义 才 值得 写 下 
来 。 那 么 是 什么 把 代码 和 它 的 含义 连接 在 一 起 呢 ? 除了 说 “ 它 做 了 该 做 的 事 "， 怎 样 才能 
将 一 个 程序 的 含义 说 得 更 具体 一 点 呢 》 本 音 ， 你 将 会 看 到 一 些 确定 计算 机 程序 含义 的 方 
法 ， 了 解 如 何 给 那些 死板 的 “静态 快照 ”注入 生命 气息 。 

















2.1 “含义 ”的 含义 

在 语言 学 中 ， 语 义学 (semantics) 研究 的 是 单词 和 它们 含义 之 间 的 关系 : 单词 “dog” 是 
纸 上 一 些 符号 的 组 合 ， 或 是 由 某 个 人 声带 引起 的 一 系列 空气 振动 ， 这 与 真正 的 狗 或 者 通常 
意义 上 狗 的 概念 极为 不 同 。 语 义 不 止 关注 抽象 含义 本 身 的 基本 性 质 ， 还 关注 具体 的 记号 如 
何 与 它们 的 抽象 含义 关联 起 来 。 

计算 机 科学 里 ， 形 式 语义 学 注重 找到 确定 程序 难以 捉摸 的 含义 的 方法 ， 并 利用 这 些 方 法 发 
现 或 者 证 明 编程 语言 中 有 趣 的 东西 。 形 式 语义 学 得 到 了 广泛 应 用 ， 从 定义 新 的 语言 和 进行 
编译 优化 这 种 具体 的 应 用 ， 到 构造 程序 正确 性 的 数学 证 明 这 样 更 抽象 的 领域 不 一 而 足 。 


为 了 完整 地 定义 编程 语言 , 我 们 需要 : 语法 , 描述 程序 看 起 来 是 什么 样 的 ; 语义 (semantics) ，， 
描述 程序 的 含义 。 


许多 语言 都 没有 官方 的 书面 规范 ， 而 只 有 一 个 可 用 的 解释 器 或 者 编译 器 。Ruby 本 身 算是 
“ 靠 实现 规范 ”这 一 类 : 尽管 有 很 多 关于 Ruby 应 该 如 何 工作 的 书 和 教程 ， 但 这 些 资 料 的 最 
终 源 头 都 是 松本 行 弘 先 生 (Matz) 的 Ruby 解释 器 (MRI, Matz’s Ruby Interpreter) ， 这 是 
Ruby 的 参考 实现 。 如 果 任 何 一 份 Ruby 文档 与 MRI 的 实际 行为 不 一 致 ， 那 必然 是 文档 错 
了 ; JRuby、Rubinius 以 及 MacRuby 这 些 第 三 方 实现 都 只 能 努力 地 精准 模拟 MRI 的 行为 ， 
只 有 如 此 ， 它 们 才 可 以 声称 自己 与 Ruby 语言 有 效 地 兼容 。 其 他 像 PHP 和 Perl 5 这 样 的 语 
言 ， 也 使 用 了 这 种 以 实现 为 主导 的 语言 定义 方法 。 
另 一 种 描述 编程 语言 的 方法 ， 就 是 写 一 份 平实 的 官方 规范 (一 般 是 英语 的 )。C++、Java 以 
及 ECMAScript (JavaScript 的 标准 版 本 ) 都 使 用 了 这 种 方法 : 这 些 语言 的 标准 化 通过 由 专 
家 委员 会 写成 的 、 与 实现 无 关 的 文档 来 完成 ， 而 且 会 存在 很 多 与 这 些 标准 兼容 的 实现 。 比 
起 只 是 依赖 于 一 个 参考 实现 ， 用 官方 文档 规范 定义 一 种 语言 更 为 严谨 : 这 样 所 做 的 设计 决 
策 更 有 可 能 是 经 过 深 思 熟 虑 、 进 行 理性 选择 之 后 的 ， 而 不 是 某 一 个 特定 实现 的 意外 结果 。 
但 是 ， 规 范 通常 非常 难 懂 ， 而 且 很 难 讲 规范 中 是 不 是 含有 了 矛盾、 玻 漏 和 有 歧义 的 地 方 。 特 
别 是 一 份 英语 规范 没有 形式 化 的 方法 可 以 进行 推导 ， 我 们 只 能 完整 彻底 地 阅读 规范 ， 大 量 
地 思 基 ， 然 后 寄 希 望 于 这 样 就 可 以 掌握 所 有 的 前 因 后 果 。 




































































赚 六 


es Ruby 1.8.7 的 规范 确实 存在 ， 甚 至 已 经 被 接受 为 ISO 标准 了 (ISO/EC 
“4 











30170) “。 尽 管 mruby 工程 (https://github.com/mruby/mruby) 尝试 构建 一 份 
~ 轻 量 级 、 幅 入 式 的 Ruby 实现 ， 并 且 明 确 声 明 将 与 ISO 标准 而 不 是 MRI 兼 
容 ， 但 MRI 仍然 被 认为 是 Ruby 语言 由 实现 定义 的 权威 规范 。 





























注 1: 在 讨论 编程 语言 理论 的 环境 下 ， 单 词 semantics 通常 被 当 作 单 数 对 待 : 我 们 通过 为 语言 赋予 语义 来 描 

















述 这 种 语言 的 含义 。 
注 2: 尽管 访问 ISO/EC 30170 需要 支付 费用 ， 但 这 一 规范 的 一 份 早期 草案 可 以 免费 下 载 : http:Wipa.go.jp/ 
osc/english/ruby/。 
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第 三 种 方法 是 使 用 形式 语义 学 中 的 数学 方法 准确 描述 编程 语言 的 含义 。 它 的 目标 是 不 仅 能 
用 适合 系统 分 析 甚 至 自动 化 分 析 的 格式 写 出 规范 ， 还 能 保证 其 完全 没有 歧义 ， 这 样 就 可 以 
对 规范 是 否 一 致 、 是 否 售 有 冲突 ， 以 及 是 否 有 玻 漏 进行 全 面 检查 。 在 介绍 如 何 处 理 语法 之 
后 ， 我 们 将 会 看 到 语义 规范 的 这 些 形式 化 方法 。 








2.2 ”语法 
传统 的 计算 机 程序 是 长 长 的 字符 串 。 每 一 种 编程 语言 都 有 一 系列 规则 ， 描 述 在 那 种 语言 
什么 样 的 字符 串 被 认为 是 有 效 程序 。 这 些 规则 定义 了 这 种 语言 的 语法 。 





通过 语言 的 语法 规则 ， 我 们 能 把 像 y = x + 1 这样 可 能 有 效 的 程序 与 像 >/;x:1@4 这 样 毫 
无 意义 的 字符 串 区 分 开 。 语 法 规则 还 为 如 何 阅 读 一 些 具 有 二 义 性 的 程序 提供 了 有 用 信息 ， 
例如 运算 符 优 先 级 的 规则 能 够 自动 判定 1 + 2 * 3 按 其 本 意 1 + (2 * 3) 处 理 ， 而 不 是 按 
(1 + 2) * 3 处 理 。 























然 ， 计 算 机 程序 的 预期 用 途 是 被 计算 机 读 取 ， 而 要 读 程 序 就 需要 语法 解析 器 : 这 个 分 析 
3 程序 能 够 读 取 代表 程序 的 字符 串 ， 根 据 语 法 规则 检查 它 是 否 有 效 ， 然 后 把 它 转换 成 一 个 
适合 被 进一步 处 理 的 结构 化 表示 。 


有 各 种 各 样 的 工具 能 把 一 种 语言 的 语法 规则 自动 转换 成 一 个 语法 解析 器 。 具 体 如何 对 这 些 
规则 进行 定义 ， 以 及 把 它们 转 成 可 用 语法 解析 器 的 技术 ， 并 不 是 本 章 的 讲解 重点 (2.6 布 
进行 了 简单 介绍 ) ， 但 总 体 来 讲 一 个 语法 解析 器 应 该 读 入 像 y = x + 1 这 样 的 字符 串 ， 然 后 
把 它 转换 成 抽象 语法 树 (AST)。 抽 象 语法 树 是 源 代码 的 一 种 表示 ， 去 掉 了 空格 之 类 的 无 关 
细节 ， 而 只 关注 程序 的 分 层 结构 。 


语法 关心 的 只 是 程序 的 表面 是 什么 样 的 ， 而 不 是 它 的 含义 。 程 序 有 可 能 语法 正确 但 没有 任 
何 实际 意义 。 例 如 ,程序 y = x + 1 本身 可 能 没有 任何 意义 ， 因 为 并 没有 事先 说 明 x 是 什 
么 ， 而 程序 z = true + 1 可 能 会 在 运行 时 候 报错 ， 因 为 它 试图 在 一 个 布尔 型 值 上 加 数字 。 
(当然 ， 这 依赖 于 具体 编程 语言 的 其 他 属性 。) 





看 更 上 败 






































正如 我 们 所 料 ， 能 说 明 如 何 把 一 种 编程 语言 的 语法 与 这 个 语法 暗含 的 语义 对 应 起 来 的 “ 唯 
一 正 途 ”并 不 存在 。 实 际 上 ， 关 于 程序 的 含义 有 几 种 不 同 的 研究 方法 ， 它 们 都 在 形式 化 
(formality)、 抽 象 度 (abstraction)、 可 表达 性 (expressiveness) 和 实际 效率 (efficiency ) 
之 间 做 了 权衡 。 在 接 下 来 的 几 节 里 ， 我 们 将 看 到 这 些 主 要 的 形式 化 方法 ， 并 了 解 它 们 之 间 
的 联系 。 


2.3 ”操作 语义 


考虑 程序 含义 的 最 实际 方法 是 思 萎 它 做 了 些 什么 : 在 运行 程序 的 时 候 ， 我 们 期 望 发 生 什么 





呢 ? 在 运行 时 编程 语言 中 不 同 的 结构 都 是 如 何 表现 的 ?把 它们 放 到 一 起 组 成 更 大 的 程序 时 
会 是 什么 效果 ? 


这 是 操作 语义 学 (operational semantic) 的 基础 ， 这 种 方法 为 程序 在 某 种 机 器 上 的 执行 定义 
些 规则 ， 以 此 来 捕捉 编程 语言 的 含义 。 这 个 机 器 常常 是 一 种 抽象 的 机 器 : 为 了 解释 这 种 
语言 所 写 的 程序 如 何 执行 而 设计 出 来 的 一 个 想象 的 、 理 想 化 的 计算 机 。 为 了 更 好 地 捕获 编 
程 语言 的 运行 时 行为 ， 通 常 需要 针对 不 同 种 类 的 编程 语言 设计 不 同 的 抽象 机 器 。 

有 了 操作 语义 ， 我们 可 以 朝 着 严谨 而 准确 地 研究 语言 中 特定 结构 的 目标 前 进 了 。 用 英语 写 
成 的 语言 规范 可 能 暗藏 着 二 义 性 ， 并 且 可 能 遗漏 边缘 情况 ， 但 一 个 形式 化 的 操作 性 规范 不 
会 如 此 ， 为 了 令 人 信服 地 传达 语言 的 行为 ， 它 必须 明确 而 且 无 二 义 性 。 








2.3.1 小 步 语义 

那么 ， 我 们 如 何 设计 一 台 抽 象 机 器 ， 并 使 用 它 定 义 一 种 编程 语言 的 操作 语义 呢 ? 一 种 方法 
就 是 假想 一 台 机 器 ， 用 这 人 台 机 器 直接 按照 这 种 语言 的 语法 进行 操作 一 小 步 一 小 步 地 对 其 进 
行 反 复 规约 ， 从 而 对 一 个 程序 求 值 。 不 管 最 后 得 到 的 结果 含义 是 什么 ， 我 们 每 一 步 都 能 让 
程序 更 接近 最 终结 果 。 


这 种 小 步 规约 类 似 于 对 代数 式 求 值 的 方式 。 例 如 ， 为 了 对 (1 x2) + (3x4) 求 值 ， 我 们 知道 
应 该 : 

(1) 执行 左 侧 的 乘法 (1x 2 变 成 了 2)， 这 样 表达 式 就 规约 成 了 2 + (3 x 4); 

(2) 执行 右 侧 的 乘法 (3x4 变 成 了 12) ， 这 样 表 达 式 规约 成 了 2 + 12; 

(3) 执行 加 法 (2 + 12 变 成 了 14) ， 最 终 得 到 14。 

我 们 可 以 认为 14 就 是 结果 ， 因 为 通过 上 面 步骤 已 经 不 能 再 进一步 规约 了 ;我们 认为 14 是 
一 个 特殊 代数 表达 式 ， 它 是 一 个 值 ， 有 自己 的 含义 ， 不 需要 进一步 的 努力 了 。 

把 如 何 进行 每 一 小 步 的 规约 写成 形式 化 规则 ， 这 个 非 形 式 化 的 过 程 就 可 以 转换 成 一 个 操 
作 语 义 。 这 些 规则 本 身 需 要 用 某 种 语言 (元 语言 ) 写 下 来 ， 而 这 种 语言 通常 是 数学 符号 。 
本 章 ， 我 们 将 探索 一 个 玩具 级 编程 语言 的 语义 ， 姑 且 将 这 种 语言 叫 作 Simple 。 















































Simple 的 小 步 语义 (small-step semantic) 的 数学 化 描述 如 下 所 示 : 


注 3: 你 可 以 把 它 看 成 简单 命令 式 语言 (simple imperative language) 的 缩写 。 
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(e1,0) we el (e210) we 的 


{Ee1+€2,0) we el + e2 (V1 + €2,0) re ol+e9 
一 -一 一 一 im =ml 十 刀 
(ni1 + n2,0) en 


(e1,0) we el (€2,0) se e9 
{el * €2,0) we ei * E2 (V1 * €2,0) ~re V1 * C2 


一 一 一 一 一 让 交 王 TDlIX7n2 
(ml * Nn2,0) en 


(e110) we 6 (€2,0) re e9 
(el < €2,0) we €1 < €2 (V1 < €2,0) we v1 < 6 
if ni < nz 让 ml > nz 








(Nn1 < n2,0) we true (nl < n2,0) ~e false 


人 we if zw E dom(o) 


{€,0) eel 


(T=€,0) ~s (T= e',0) (T=V,0) ~ (do-nothing, olz 上 1)) 


{€,0) ee 
{if (e) { sl } else { s2 },0) ~ (if (e’) { 81 } else { s2 },0) 


(if (true) { sl } else { sz },0) ~ (51,0) {if (false) { sl } else { sz },0) ~», (52,0) 


(81,0) ss (81,0") 
(31; 82,0) os (31; 52,0) {do-nothing; s2,0) ~s (s2,0) 








{while (e) {s },0) ~ (if (e) { s; while (e) {s }} else {do-nothing },o) 


从 数学 上 讲 ， 这 是 一 个 推理 规则 的 集合 ， 它 定义 了 基于 Simple 抽象 语法 树 的 一 个 规约 关系 。 
实际 点 儿 讲 ， 这 是 一 堆 怪 异 的 符号 ， 关 于 计算 机 程序 的 含义 它 没 有 讲 任 何 能 让 人 理解 的 东西 。 
我 们 不 会 试图 直接 理解 这 种 形式 化 的 符号 ， 而 是 研究 如 何 用 Ruby 编写 同样 的 推导 规则 。 
对 程序 员 来 说 使 用 Ruby 做 元 语言 更 容易 理解 ， 而 且 这 样 还 有 一 个 优点 ， 就 是 这 些 规 则 可 
以 执行 ， 我们 能 看 到 它们 是 如 何 工作 的 。 





我 们 并 不 打算 尝试 用 “ 靠 实现 来 规范 ”的 方式 描述 Simple 的 语义 。 使 用 Ruby 
一 人 > 而 不 是 用 数学 符号 来 描述 小 步 语义 ， 主 要 是 为 了 使 描述 更 容易 被 人 们 所 理解 。 
最 终 得 到 一 个 这 种 语言 的 可 执行 实现 ， 只 是 这 么 做 的 额外 好 处 。 























使 用 Ruby 有 一 大 缺点 : 这 是 在 使 用 一 种 更 复杂 的 语言 解释 一 种 简单 的 语言 ， 
从 哲学 上 来 说 这 可 能 很 失败 。 我 们 应 该 记 住 ， 数 学 化 的 规则 是 语义 的 权威 描 
述 ， 而 使 用 Ruby 只 是 为 了 更 容易 地 理解 这 些 规则 的 含义 。 











1. 表达 式 

首先 来 研究 一 下 Simple 语言 中 表达 式 的 语义 。 规 则 将 作用 于 这 些 表达 式 的 抽象 语法 树 ， 所 
以 我 们 必须 把 Simple 表达 式 表示 成 Ruby 对 象 。 要 做 到 这 一 点 ， 一 种 方式 就 是 为 Simple 
语法 中 每 一 种 不 同 的 元 素 都 定义 一 个 Ruby 类 ， 包 括 数字 (number)、 加 法 (add) 、 乘 法 
(multiply) 等 ， 然 后 把 每 一 个 表达 式 表 示 成 由 这 些 类 的 实例 构成 的 一 棵 树 。 


例如 ， 下 面 是 Number、Add 和 Multiply 三 个 类 的 定义 : 





class Number < Struct.new(:value) 
end 


class Add < Struct.new(:left, :right) 
end 


class Multiply < Struct.new(:left, :right) 
end 


实例 化 这 些 类 来 手工 构造 抽象 语法 树 : 


>> Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 


=> #<struct Add 

left=#<struct Multiply 
left=#<struct Number value=1>, 
right=#<struct Number Value=2> 

>， 

right=#<struct Multiply 
left=#<struct Number Value=3>， 
right=#<struct Number Value=4> 

> 

> 


说 忆 


当然 ， 最 终 我 们 想 通 过 一 个 语法 解析 器 自动 构建 这 些 树 。2.6 节 将 介绍 如 何 


4 A 
uw 4 ， 完 成 这 件 事 情 。 
0, 























三 个 类 (Number、Add 和 Multiply) 都 继承 了 Struct 对 失 nspect 的 通用 定义 ， 所 以 在 IRB 
中 它们 实例 的 字符 串 表 示 会 含有 大 量 不 重要 的 细节 。 为 了 方便 在 IRB 中 查看 抽象 语法 树 的 
内 容 ， 我 们 将 覆盖 每 个 类 的 栖 nspect 方法 *， 让 它 返回 自 定义 的 字符 串 表 示 : 











class Number 
def to s 
value.to s 
end 


def inspect 
"«#{self}»" 





注 4: 为 了 让 代码 保持 简单 ， 我 们 将 抑制 住 把 公共 代码 提取 到 超 类 或 者 模块 中 的 欲望 。 





22 | 第 2 章 


end 
end 


class Add 
def to_s 
"#{left} + #{right}" 
end 


def inspect 
"«#{self}»" 
end 
end 


class Multiply 
def to_s 
"#{left} * #{right}" 
end 


def inspect 
"«#{self}»" 
end 
end 


这 样 每 个 抽象 语法 树 都 将 在 IRB 中 以 Simple 源 代码 的 形式 呈现 ， 外 边 会 加 上 


BB 名 号 (<) 





以 便 与 正常 的 Ruby 值 区 分 。 


>> Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 


=> 《人 1 *2+3*4» 
>> Number.new(5) 
=> «5» 


照 传 统 的 优先 级 规则 (例如 * 通 常 比 + 优先 级 更 高 ) 它们 的 输出 是 不 正确 


Ee 


的 。 以 下 面 的 抽象 语法 树 为 例 : 


>> Multiply.new( 
Number.new(1)， 
Multiply.new( 
Add.new(Number.new(2), Number.new(3)), 
Number .new(4) 


) 


=> «1 * 2+3*4» 


这 村 树 表示 «1 * (2 + 3) * 4» 与 <1* 2 + 3* 4» 不 是 一 个 表达 式 (具有 不 





同 的 含义 )， 但 字符 串 表 示 并 没有 反映 出 这 一 点 。 
这 个 问题 很 严重 ， 但 与 我 们 关于 语义 的 讨论 完全 无 关 。 为 简单 起 见 ， 





暂时 先 


忽略 此 事 ， 避 开 可 能 拥有 不 正确 字符 串 描述 的 表达 式 。 我 们 将 在 3.3.1 节 为 








另 一 种 语言 给 出 更 合适 的 实现 。 





现在 为 抽象 语法 树 定义 规约 方法 ， 这 将 是 我 们 实现 一 个 小 步 操作 语义 的 起 点 。 也 就 是 说 ， 
代码 可 以 以 一 个 抽象 语法 树 作 为 输入 ， 然 后 生成 一 个 规约 树 作为 输出 。 


在 实现 规约 本 身 之 前 ， 我 们 先 要 区 分 什么 样 的 表达 式 能 规约 ， 什 么 样 的 表达 式 不 能 规约 。 
Add 和 Multiply 表达 式 总 是 能 规约 的 【它们 的 每 一 个 表达 式 都 表示 一 个 操作 ， 并 能 够 通过 
那 种 操作 对 应 的 计算 变 成 一 个 结果 ) ， 但 是 Number 表达 式 总 是 代表 一 个 值 ， 它 就 不 能 规约 
成 任何 其 他 东西 了 。 





原则 上 ， 我 们 可 以 使 用 简单 的 #reducible? 断言 把 这 两 种 表达 式 区 分 开 ， 它 能 判断 参数 是 
否 可 规约 ， 并 返回 true 或 者 false: 


def reducible?(expression) 
case expression 
when Number 
false 
when Add, Multiply 
true 


end 
end 





在 Ruby 的 case 语句 里 ,控制 表达 式 与 case 值 是 否 匹配 ， 是 通过 将 控制 表 

达 式 的 值 作为 参数 调用 每 个 case 值 的 #== 方 法 来 判断 的 。 方 法 #== 的 实 

， 现 会 检查 它 的 参数 是 否 是 那个 类 或 者 那个 子 类 的 实例 ， 这 样 我 们 可 以 使 用 
“case 对 象 when 类 名 ”这 样 的 语法 为 一 个 类 匹配 一 个 对 象 。 




















但 是 ， 在 一 种 面向 对 象 语言 里 这 么 写 代码 通常 被 认为 是 不 好 的 做 法 “， 如 果 一 些 运算 的 行 
为 依赖 于 它 参 数 的 类 型 ， 典 型 的 做 法 是 将 这 种 每 个 类 都 有 的 行为 实现 为 它们 的 实例 方法 ， 
从 而 让 语言 隐 式 地 决定 调用 哪个 方法 ， 而 不 是 使 用 显 式 的 case 语句 。 





因此 ， 我 们 将 分 别 为 Number、Add 和 Multiply 实现 #reducible? 方法 : 


class Number 
def reducible? 
false 
end 
end 


class Add 
def reducible? 
true 
end 
end 


class Multiply 
def reducible? 


注 5: 尽管 我 们 用 Haskell 或 者 ML 这 样 的 函数 式 语 言 写 #reducible? 时 就 是 这 么 写 的 。 
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true 
end 
end 


这 回 的 表现 正 是 我 们 想 要 的 : 


>> Number.new(1).reducible? 

=> false 

>> Add.new(Number.new(1), Number.new(2)).reducible? 
=> true 





现在 可 以 为 这 些 表达 式 实现 规约 了 : 像 上 面 一 样 ， 我 们 为 Add 和 Multiply 定义 一 个 
#reduce 方法 。 既 然 数 字 不 能 再 规约 ， 那 就 没有 必要 定义 Number#reduce 了 ， 因 此 除非 确切 
知道 一 个 表达 式 能 够 规约 ， 否 则 不 要 对 其 调用 #reduce 方法 。 


























那么 规约 加 法 表达 式 的 规则 是 什么 呢 ? 如 果 左 右 参数 都 是 数字 ， 那 我 们 就 能 把 它们 加 到 一 
起 ， 但 如 果 其 中 一 个 或 者 所 有 参数 需要 规约 怎么 办 ? 既然 我 们 在 考虑 一 小 步 一 小 步 地 进行 
规约 ， 那 就 有 必要 在 它们 都 符合 规约 条 件 的 时 候 决定 哪个 参数 先进 行规 约 "。 一 个 常用 的 
策略 是 按照 从 左 到 右 的 顺序 对 参数 进行 规约 ， 规 则 是 这 样 的 : 

。 如 果 加 法 左边 的 参数 能 够 规约 ， 就 规约 左边 的 参数 ， 


。 如 果 加 法 左边 的 参数 不 能 规约 ， 但 是 右边 的 参数 可 以 规约 ， 就 规约 右边 的 参数 ; 
。 如 有 果 两 边 都 不 能 规约 ， 它 们 应 该 都 是 数字 了 ， 就 把 它们 加 到 一 起 。 














上 面 这 些 规则 的 结构 是 小 步 规 约 操作 语义 的 特征 。 每 一 个 规则 都 提供 了 它 能 得 以 应 用 的 表 
达 式 模式 (左边 参数 可 规约 的 加 法 ， 右 边 参 数 可 规约 的 加 法 ， 两 边 参数 分 别 都 不 能 规约 的 
加 法 )， 还 有 对 当 模 式 匹配 上 之 后 如 何 构建 一 个 规约 后 的 新 表达 式 的 描述 。 选 择 了 这 些 特 
定 的 规则 之 后 ， 我 们 不 仅 确定 了 那些 参数 分 别 规约 好 之 后 应 该 如 何 合并 到 一 起 ， 还 特别 指 
出 了 一 个 Simple 表达 式 要 使 用 从 左 到 右 求 值 的 方法 对 参数 进行 规约 。 








我 们 可 以 把 这 些 规则 直接 翻译 成 一 个 Add#reduce 的 实现 ， 同 样 的 代码 对 Multiply#reduce 
也 适用 ( 别 忘 了 要 把 参数 乘 起 来 而 不 是 加 起 来 ) : 


class Add 
def reduce 
if left.reducible? 
Add.new(left.reduce, right) 
elsif right.reducible? 
Add.new(left, right.reduce) 
else 
Number.new(left.value + right.value) 
end 
end 
end 





注 6: 选择 什么 顺序 并 没有 区 别 ， 但 是 在 这 个 时 候 我 们 必须 做 出 决策 。 

















class Multiply 
def reduce 
if left.reducible? 
Multiply.new(left.reduce, right) 
elsif right.reducible? 
Multiply.new(left, right.reduce) 
else 
Number.new(left.value * right.value) 
end 
end 


end 


方法 #reduce 总 是 构建 出 新 的 表达 式 ， 而 不 是 对 已 有 的 表达 式 进行 修改 。 








为 这 几 种 表达 式 实 现 了 #reduce 方法 之 后 ， 我 们 可 以 反复 对 其 进行 调用 ， 从 而 通过 很 多 的 
一 小 步 来 完整 地 求 出 表达 式 的 值 : 


>> expression = 
Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 


=> «1 * 2+3*4» 
>> expression.reducible? 


=> true 

>> expression = expression.reduce 
=> «2 +3*4» 

>> expression.reducible? 

=> true 

>> expression = expression.reduce 
=> «2 + 12» 

>> expression.reducible? 

=> true 

>> expression = expression.reduce 
>> expression.reducible? 

=> false 


注意 ，#reduce 总 是 把 一 个 表达 式 转换 成 另 一 个 表达 式 ， 这 正 是 小 步 规约 操 
。 作 语义 应 该 遵守 的 规则 。 特 别 要 注意 的 是 ，Add.new(Number.new(2),NumbeT. 
4 new(12)).reduce 返回 的 Number.new(14) 表示 Simple 表达 式 ， 而 不 仅仅 是 14 
这 个 Ruby 中 的 数字 。 


Simple 语言 〈 我 们 正在 为 其 定义 语义 ) 和 Ruby 元 语言 (我 们 正在 使 用 它 定 
义 语 义 ) 在 明显 不 同 的 时 候 区 分 起 来 很 容易 一 一 就 像 元 语言 是 数学 符号 而 不 
是 一 种 程序 设计 语言 时 一 样 容易 区 分 一 一 但 是 这 里 因为 两 种 语言 看 起 来 很 
像 ， 所 以 需要 更 加 小 心 。 



























































我 们 在 维护 着 一 个 状态 一 一 也 就 是 当前 表达 式 一 一 并 且 对 其 反复 调用 #reducible? 和 
#reduce， 直 到 得 到 了 一 个 值 为 止 ， 通 过 这 种 方式 ， 可 以 手工 模拟 一 个 抽象 机 器 对 表达 式 求 
值 的 操作 。 为 了 节省 点 力气 ， 也 为 了 让 这 个 抽象 机 器 的 思想 更 为 具体 ， 我 们 可 以 轻松 地 写 





些 Ruby 代码 。 把 这 些 代码 和 状态 封装 到 一 个 类 里 ， 并 称 为 虚拟 机 : 


class Machine < Struct.new(:expression) 
def step 
self.expression = expression.reduce 
end 


def run 
while expression.reducible? 
puts expression 
step 
end 
puts expression 
end 
end 


这 允许 我 们 用 一 个 表达 式 实例 化 一 个 虚拟 机 ， 让 它 运行 (#un)， 并 观察 逐渐 规约 的 各 个 步 


又 : 


>> Machine.new( 
Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 
) 
) .run 
1*2+3*4 
2+3*4 
2 + 12 
14 
=> nil 





要 扩展 这 个 实现 以 支持 其 他 简单 的 值 和 运算 并 不 难 : 减法 和 除法 ， 布 尔 值 true 和 false， 














布尔 运算 and、or 和 not， 对 数字 进行 比较 并 返回 布尔 值 的 运算 





个 布尔 值 以 及 小 于 运算 的 实现 : 


class Boolean < Struct.new(:value) 
def to _s 
value.to s 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
false 
end 
end 





例如 ， 下 驮 








| 是 一 








class LessThan < Struct.new(:left, :right) 
def to s 
"#{left} < #{right}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce 
if left.reducible? 
LessThan.new(left.reduce, right) 
elsif right.reducible? 
LessThan.new(left, right.reduce) 
else 
Boolean.new(left.value < right.value) 
end 
end 
end 


这 仍然 允许 我 们 一 小 步 一 小 步 地 规约 布尔 表达 式 : 


>> Machine.new( 
LessThan.new(Number.new(5), Add.new(Number.new(2), Number.new(2))) 
) .run 
5<2+2 
5<4 
false 
=$ WL 


目前 为 止 都 是 直截了当 的 东西 : 我 们 通过 实现 能 对 一 种 语言 求 值 的 虚拟 机 来 定义 它 的 操作 
语义 。 虚 拟 机 当前 的 状态 就 是 当前 的 表达 式 ， 而 机 器 的 行为 是 由 一 个 规则 集合 来 描述 的 ， 
这 个 规则 集合 负责 管理 机 器 运行 时 的 状态 切换 。 我 们 已 经 把 机 器 实现 成 了 程序 ， 这 个 程序 
跟踪 当前 表达 式 ， 持 续 对 其 进行 规约 ， 并 随 之 更 新 表达 式 ， 直 到 没有 更 进一步 的 规约 可 以 
继续 执行 为 止 。 


但 是 这 种 由 简单 代数 表达 式 组 成 的 语言 不 是 十 分 有 趣 ， 这 种 语言 没有 儿 个 我 们 期 望 拥有 的 
哪怕 是 最 简单 编程 语言 中 的 特性 。 接 下 来 我 们 把 它 构建 得 更 复杂 一 些 ， 让 它 看 起 来 更 像 是 
一 种 能 写 出 有 用 程序 的 语言 。 


首先 ，Simple 有 一 个 明显 缺失 的 东西 : 变量 。 在 任何 有 用 的 语言 中 ， 我 们 都 期 望 在 讨论 值 
时 能 够 使 用 有 意义 的 名 字 而 不 是 它们 本 身 的 字面 值 。 这 些 名 字 提 供 了 一 个 间接 层 ， 这 样 同 
一 个 代码 可 以 用 来 处 理 很 多 不 同 的 值 一 一 包括 来 自 于 程序 外 部 因而 在 写 代 码 时 其 至 都 不 知 
道 的 值 。 















































我 们 可 以 引入 一 个 新 的 表达 式 类 Variable 来 表示 Simple 中 的 变量 : 





class Variable < Struct.new(:name) 
def to_s 
name.to s 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 
end 


为 了 能 规约 一 个 变量 ， 抽 象 机 器 不 仅仅 需要 存储 当前 表达 式 ， 还 要 存储 从 变量 名 称 到 它 
们 值 的 映射 一 一 环境 (environment)。 在 Ruby 中 ， 我 们 可 以 把 这 个 映射 实现 成 一 个 散 列 
表 (hash)， 其 中 用 符号 作为 键 ， 用 表达 式 对 象 作为 值 ， 例 如 ， 散 列表 {x:Number.new(2)， 
y:Boolean.new(false) } 是 一 个 环境 ， 它 分 别 把 变量 x 和 y 与 Simple 的 数字 和 布尔 值 进行 
了 关联 。 














寺 


对 这 种 语言 来 说 ， 环 境 的 目的 只 是 把 变量 名 映射 到 Number.new(2) 这 样 不 可 
ws 。 规 约 的 值 上 ， 而 不 是 映射 到 Add.new(Number.new(1)， Number.new(2)) 这 样 可 
会 ”以 规约 的 表达 式 。 稍 后 我 们 编写 能 改变 环境 的 规则 时 要 注意 这 个 约束 。 





有 了 环境 ， 我 们 很 容易 实现 Variable#reduce: 它 只 是 在 环境 里 查找 变量 的 名 字 并 返回 其 值 。 


class Variable 
def reduce(environment) 
environment[name] 
end 
end 


注意 ， 我 们 正在 把 一 个 环境 作为 参数 传 进 #reduce， 所 以 需要 修改 其 他 类 的 #reduce 的 实 
现 ， 以 便 能 接受 和 提供 这 个 参数 : 


class Add 
def reduce(environment) 
if left.reducible? 
Add.new(left.reduce(environment), right) 
elsif right.reducible? 
Add.new(left, right.reduce(environment)) 
else 
Number.new(left.value + right.value) 
end 
end 
end 





class Multiply 
def reduce(environment) 
if left.reducible? 
Multiply.new(left.reduce(environment), right) 
elsif right.reducible? 
Multiply.new(left, right.reduce(environment)) 
else 
Number.new(left.value * right.value) 
end 
end 
end 


class LessThan 
def reduce(environment) 
if left.reducible? 
LessThan.new(left.reduce(environment), right) 
elsif right.reducible? 
LessThan.new(left, right.reduce(environment)) 
else 
Boolean.new(left.value < right.value) 
end 
end 
end 


现在 #educe 的 所 有 实现 在 更 新 之 后 都 已 经 能 支持 环境 了 ， 因 此 还 需要 重新 定义 虚拟 机 ， 
以 便 维持 一 个 环境 并 把 它 提供 给 #reduce; 

















0bject.send(:remove_const，:Machine) # 忘记 原来 的 Machine 类 


class Machine < Struct.new(:expression, :environment) 
def step 
self.expression = expression.reduce(environment) 
end 


def run 
while expression.reducible? 
puts expression 
step 
end 


puts expression 
end 
end 


机 器 对 #run 的 定义 仍然 没 变 ， 但 它 有 了 一 个 新 的 环境 属性 ， 这 个 属性 提供 给 #step 方法 新 
的 实现 使 用 。 


























现在 只 要 我 们 也 提供 一 个 包含 变量 值 的 环境 ， 就 可 以 对 包含 变量 的 表达 式 进行 规约 了 : 


>> Machine.new( 
Add.new(Variable.new(:x)，Variable.new(:y))， 
{ x: Number.new(3), y: Number.new(4) } 
).run 





X + y 
3 +y 
3 + 4 
7 
=> nil 
环境 的 引入 完成 了 表达 式 的 操作 语义 。 我 们 已 经 设计 了 抽象 机 器 ， 它 由 一 个 初始 表达 式 和 
环境 开始 ， 然 后 在 每 次 规约 的 一 小 步 中 使 用 当前 的 表达 式 和 环境 生成 一 个 新 的 表达 式 ， 这 
个 过 程 中 环境 始终 没有 改变 。 


2. 语句 
现在 我 们 可 以 看 一 下 另 一 种 程序 结构 的 实现 : 语句 。 它 是 一 个 表达 式 ， 用 来 求 值 生成 另 
一 个 表达 式 ， 换 句 话说 ， 一 个 语句 能 够 通过 求 值 改变 抽象 机 器 的 状态 。 机 器 唯一 的 状态 
(除了 当前 程序 ) 就 是 环境 ， 因 此 我 们 将 允许 Simple 的 语句 生成 一 个 新 的 环境 以 蔡 换 当前 
环境 。 

















最 简单 的 语句 就 是 什么 都 不 做 的 语句 ， 它 不 能 规约 ， 因 为 对 环境 没有 任何 影响 。 这 实现 起 
来 很 简单 : 
class DoNothing ©@ 
def to _s 


"do-nothing 
end 


def inspect 
"«#{self}»" 
end 


def ==(other statement) @ 
other_statement .instance_of?(DoNothing) 
end 


def reducible? 
false 
end 
end 


@ 其 他 所 有 语法 类 都 从 Struct 类 继承 ， 但 是 DoNothing 没有 继承 任何 类 。 这 是 因为 
DoNothing 什么 属性 都 没有 ， 而 且 遗 憾 的 是 ，Struct.new 还 不 让 我 们 传 一 个 空 的 属性 名 
称 列表 。 


名 想 要 比较 任意 两 个 语句 是 否 相 等 。 其 他 类 都 从 Struct 继承 了 扩 = 的 实现 ， 但 DoNothing 
只 能 定义 它 自 己 的 了 。 


一 个 什么 都 不 做 的 语句 可 能 看 起 来 没什么 意义 ， 但 是 能 有 一 个 特殊 的 语句 表示 程序 已 经 执行 成 
功 会 非常 方便 。 其 他 语句 完成 了 它们 的 工作 之 后 ， 我 们 会 将 它们 最 终 规约 成 «do-nothing»。 




















要 看 个 实用 语句 的 例子 ， 最 简单 的 就 是 像 xx = x + 1» 这 样 的 赋值 语句 ， 但 在 实现 赋值 语 
句 之 前 ， 我 们 还 需要 决定 它 的 规约 规则 。 


一 个 赋值 语句 由 一 个 变量 名 (x)、 一 个 等 号 和 一 个 表达 式 («x + 1») 组 成 。 如 果 赋 值 语句 
中 的 表达 式 是 可 规约 的 ， 我 们 就 可 以 按照 表达 式 规 约 规则 对 其 进行 规约 并 最 终 得 到 一 个 包 
含 规约 后 表达 式 的 新 的 赋值 语句 。 例 如 ， 在 一 个 变量 x 值 为 «2» 的 环境 里 对 «x = x + 1 进 
行规 约 ， 我 们 会 得 到 语句 «x = 2 + 1»， 然 后 再 把 它 规约 就 得 到 «x = 3»。 























可 是 然后 呢 ? 如 果 表 达 式 已 经 是 “3" 这 样 的 值 了 ， 那 么 我 们 就 应 该 执行 赋值 ， 也 就 意味 着 
对 环境 进行 更 新 ， 即 把 这 个 值 与 适当 的 变量 名 关联 起 来 。 因 此 规约 一 个 语句 不 单 需 要 生成 
一 个 规约 了 的 新 语句 ， 还 要 产生 一 个 新 的 环境 ， 这 个 环境 有 了 时 候 会 与 执行 规约 时 的 环境 
不 同 。 





我 们 的 实现 将 使 用 Hashiimerge 创建 一 个 新 的 散 列 来 更 新 环境 ， 不 会 改变 
CA 
AN 由 旧 值 ; 


4 
0 





>> old environment = { y: Number.new(5) } 

= {:y=>«5»} 

>> new environment = old environment.merge({ x: Number.new(3) }) 
=> {:y=>«5», :X=>«3»} 

>> old_environment 

区 {:y=>«5»} 














可 以 选择 破坏 性 地 改变 当前 环境 ， 而 不 是 创建 一 个 新 的 ， 但 是 避免 破坏 性 的 
修改 可 以 促使 我 们 把 #reduce 的 结果 完全 明确 出 来 。 如 果 好 educe 想 要 改变 
当前 的 环境 ， 它 就 得 给 调用 者 返回 一 个 改变 后 的 环境 进行 通知 ， 反 之 ， 如 果 
它 不 返回 一 个 环境 ， 那 么 就 可 以 肯定 没有 造成 任何 变化 。 



























































这 个 约束 帮助 我 们 强化 了 表达 式 和 语句 的 区 别 。 对 于 表达 式 ， 把 一 个 环境 传 
递 给 #reduce， 人 然后 得 到 一 个 规约 了 的 表达 式 ; 因为 没有 返回 一 个 新 的 环境 ， 
所 以 很 明显 规约 一 个 表达 式 不 会 改变 环境 。 对 于 语句 ， 我 们 将 用 当前 的 环境 
周 用 #7educe， 然 后 得 到 一 个 新 的 环境 ， 这 表明 规约 一 个 语句 会 对 环境 有 影 
向。( 换 名 话说 ，Simple 小 步 语 义 的 结构 告诉 我 们 : Simple 的 表达 式 是 纯净 
无 害 的 ， 而 它 的 语句 不 是 这 样 。) 
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因此 从 一 个 空 的 环境 规约 «x = 3» 应 该 会 产生 一 个 新 的 环境 { x: Number.new(3) }, 但 是 
我 们 还 期 望 这 个 语句 以 某 种 方式 得 到 规约 ， 不然 的 话 ， 抽 象 机 器 将 会 不 断 地 把 «3» 赋值 给 
x。 这 时 候 «do-nothing» 就 派 上 用 场 了 : 一 个 完整 的 赋值 语句 规约 成 “do-nothing”， 就 表 
明 语 句 的 规约 已 经 结束 ， 并 且 可 以 认为 新 环境 中 的 东西 就 是 执行 结果 。 


总 结 起 来 ， 赋 值 的 规约 规则 是 











如 果 赋 值 表 达 式 能 规约 ， 那 么 就 对 其 规约 ， 得 到 的 结果 就 是 一 个 规约 了 的 赋值 语句 和 一 
个 没有 改变 的 环境 ; 

如 果 赋 值 表 达 式 不 能 规约 ， 那 么 就 更 新 环境 把 这 个 表达 式 与 赋值 的 变量 关联 起 来 ， 得 到 
的 结果 是 一 个 «do-nothing» 语句 和 一 个 新 的 环境 。 





这 样 ， 我 们 就 有 了 实现 一 个 赋值 类 Assign 的 足够 信息 。 唯 一 的 困难 就 是 Assign#reduce 需 
要 既 返 回 一 个 语句 又 返回 一 个 环境 一 一 而 Ruby 的 方法 只 能 返回 一 个 对 象 一 一 但 我 们 可 以 
把 它们 放 到 由 两 个 元 素 组 成 的 数组 中 返回 ， 这 就 模拟 了 这 种 情况 























class Assign < Struct.new(:name, :expression) 
def to _s 
"#{name} = #{expression}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
if expression.reducible? 
[Assign.new(name, expression.reduce(environment)), environment] 
else 
[DoNothing.new, environment.merge({ name => expression })] 
end 
end 
end 


六 


正如 我 们 承诺 的 那样 ，Assign 的 规约 规则 保证 了 如 果 一 个 表达 式 不 可 规约 
4 (如 一 个 值 )， 它 就 只 会 增加 到 环境 上 。 


， 
人 人 





可 以 像 表 达 式 一 样 对 一 个 赋值 语句 反复 规约 ， 直 到 其 不 能 再 规约 为 止 。 这 个 方法 就 可 
以 对 一 个 赋值 表达 式 求 值 。 


>> statement = Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 
= 大 志和 

>> environment = { x: Number.new(2) } 

=> {:Xx=>«2»} 

>> statement.reducible? 

=> true 

>> statement, environment = 
=> [kx = 2 + 1», {:x=>«2»}] 
>> statement, environment = 
入 各 [«x = 3»， {:x=>«2»}] 

>> statement, environment = statement.reduce(environment) 
=> [«do-nothing», {:x=>«3»}] 


statement .reduce(environment) 


statement.reduce(environment) 





>> statement.reducible? 
=> false 




















这 个 过 程 甚至 比 手工 规约 表达 式 更 难 ， 因 此 为 了 处 理 语 句 ， 需 要 重新 实现 虚拟 机 ， 让 它 能 
在 每 一 步 规约 时 显示 当前 的 语句 和 环境 : 





Object.send(:remove const, :Machine) 


class Machine < Struct.new(:statement, :environment) 
def step 
self.statement, self.environment = statement.reduce(environment) 
end 


def run 
while statement.reducible? 
puts "#{statement}, #{environment}" 
step 
end 


puts "#{statement}, #{environment}" 
end 
end 


现在 这 台 机 器 又 可 以 为 我 们 工作 啦 : 


>> Machine.new( 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))), 
{ x: Number.new(2) } 

) .run 

x + 1, {:x=>«2»} 

xX = 2 + 1, {:x=>«2»} 

x = 3, {:x=>«2»} 

do-nothing, {:x=>«3»} 

=> nil 


x 
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可 以 看 到 ， 这 台 机 器 仍然 在 执行 表达 式 的 规约 步骤 («x + 1 规约 成 “2 + 12， 再 规约 成 
«3»)， 但 是 这 个 规约 过 程 现在 不 是 发 生 在 语法 树 的 顶层 ， 而 是 在 一 个 语句 里 。 


























既然 知道 语句 规约 是 如 何 工作 的 了 ， 那 么 我 们 就 可 以 对 其 进行 扩展 ， 以 支持 其 他 类 型 的 语 
句 。 让 上 我们 从 «if (x) { y = 1 } else { y = 2 })» 这样 的 语句 开始 ， 这 个 语句 包含 了 一 个 
叫 作 条 件 («x») 的 表达 式 ， 还 有 两 个 语句 ， 一 个 称 为 结果 («y = 1»)， 另 一 个 是 替代 话 向 
(«y = 2»)“。 对 条 件 进行 规约 的 规则 很 简单 : 














。 如 果 条 件 能 规约 ， 那 就 对 其 进行 规约 ， 得 到 的 结果 是 一 个 规约 了 的 条 件 语 句 和 一 个 没有 
改变 的 环境 ， 
。 如 果 条 件 是 表达 式 «true» 了 ， 就 规约 成 结果 语句 和 一 个 没有 变化 的 环境 ， 











注 7: 此 条 件 语句 与 Ruby 的 if 不 同 ,Ruby 中 的 if 是 返回 一 个 值 的 表达 式 ,但 是 在 Simple 中 ,这 是 一 个 语句 ， 
它 从 其 他 两 个 语句 中 选择 一 个 求 值 ， 并 且 它 唯一 的 结果 就 是 对 当前 环境 的 影响 。 
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。 如 果 条 件 是 表达 式 «false»， 就 规约 成 替代 语句 和 一 个 没有 变化 的 环境 。 


在 这 种 情况 下 ， 所 有 规则 都 不 会 改变 环境 一 一 第 一 条 规则 中 对 条 件 表达 式 的 规约 只 会 生成 
一 个 新 的 表达 式 ， 而 不 会 产生 新 的 环境 。 


下 面 是 翻译 成 If 类 的 规则 : 





class If < Struct.new(:condition, :consequence, :alternative) 
def to_s 
"if (#{condition}) { #{consequence} } else { #{alternative} }" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
if condition.reducible? 
[If.new(condition.reduce(environment), consequence, alternative), environment] 
else 
case condition 
when Boolean.new(true) 
[consequence, environment] 
when Boolean.new(false) 
[alternative, environment] 
end 
end 
end 
end 





下 面 是 规约 操作 : 











>> Machine.new( 
If.new( 
Variable.new( :x), 
Assign.new(:y, Number.new(1)), 
Assign.new(:y, Number.new(2)) 
)， 
{ x: Boolean.new(true) } 
) .run 
if (x) {y=1}else{y=2}, {:x=>«true»} 
if (true) {y= 1} else {y= 2}, {:x=>«true»} 
y = 1, {:x=>«true»} 
do-nothing, {:x=>«true», :y=>«1»} 
=> nil 


这 些 都 与 预期 一 致 ， 但 如 果 能 支持 不 带 «else» 从 句 的 条 件 语 句 就 好 了 ， 比 如 «if (x) {y = 
1}»。 幸 运 的 是 ， 把 语句 写成 «if (x) { y = 1 } else { do-nothing }» 就 可 以 做 到 ， 这 和 





没有 «else» 从 名 的 效果 是 一 样 的 : 





>> Machine.new( 
If.new(Variable.new(:x), Assign.new(:y, Number.new(1)), DoNothing.new), 
{ x: Boolean.new(false) } 
) .run 
if (x) {y= 1} else { do-nothing }, {:x=>«false»} 
if (false) { y = 1 } else { do-nothing }, {:x=>«false»} 
do-nothing, {:x=>«false»} 
=> nil 


既然 不 仅 实现 了 表达 式 ， 还 实现 了 赋值 语句 和 条 件 语句 ， 我 们 就 有 了 组 成 程序 所 需要 的 基 
础 材料 ， 这 样 的 程序 可 以 执行 计算 和 进行 决策 ， 做 实际 的 工作 。 主 要 的 限制 是 我 们 还 不 能 
把 这 些 基础 材料 “连接 ”到 一 起 : 没有 办 法 给 多 个 变量 赋值 或 者 执行 多 个 条 件 运算 ， 这 大 
幅度 地 限制 了 语言 的 可 用 性 。 




















为 摆脱 这 个 限制 我 们 可 以 再 定义 一 种 语句 一 一 序列 (sequence)， 它 把 两 个 语句 (如 «x = 1 
+ 1» 和 «y = x + 3») 连接 到 一 起 ,组 成 一 个 更 大 的 语句 (如 «x = 1+1;y=Xx+3»)。 一 旦 
有 了 序列 语句 ， 我 们 就 可 以 反复 使 用 它们 构建 更 大 的 语句 ; 例如， 序列 cx =1+1;y=xt+ 
3» 和 赋值 语句 «z = y + 5» 能 连 到 一 起 组 成 序列 cx =1+1;y=X+3;ZzZ=y+5»。 








对 序列 进行 规约 的 规则 有 点 微妙 : 


。 如 果 第 一 条 语句 是 “do-nothing”， 就 规约 成 第 二 条 语句 和 原始 的 环境 ; 
。 如 果 第 一 条 语句 不 是 «do-nothing»， 就 对 其 进行 规约 ， 得 到 的 结果 是 一 个 新 的 序列 ( 规 
约 之 后 的 第 一 条 语句 ， 后 边 跟着 第 二 条 语句 ) 和 一 个 规约 了 的 环境 。 


看 了 代码 你 会 更 清楚 这 些 规则 : 














class Sequence < Struct.new(:first, :second) 
def to s 
"#{first}; #{second}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
case first 
when DoNothing.new 





注 8: 为 了 达到 我 们 的 目的 ， 这 个 语句 构造 成 <(x = 1 + 1;y=X+3);z=y+5» 还 是 «x=1+1; 
(y = Xx +3; z = y+ 5)» 都 没有 关系 。 在 执行 规约 时 ， 这 个 选择 会 影响 规约 的 顺序 ， 但 是 两 种 方式 最 
终 的 结果 是 一 样 的 。 
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[second, environment] 
else 
reduced first, reduced environment = first.reduce(environment) 
[Sequence.new(reduced first, second), reduced environment] 
end 
end 
end 

















这 些 规则 的 总 体 效 果 就 是 : 不 断 规约 一 个 序列 时 ， 一 直 都 在 规约 它 的 第 一 个 语句 ， 直 到 成 
为 «do-nothing»， 然 后 再 去 规约 第 二 个 语句 。 在 虚拟 机 里 运行 一 个 序列 ， 我 们 可 以 看 到 这 
种 效果 : 

>> Machine.new( 
Sequence .new( 


Assign.new(:x, Add.new(Number.new(1), Number.new(1))), 
Assign.new(:y, Add.new(Variable.new(:x), Number.new(3))) 
































x=1+1;y=x+3,1{) 

x =2; y=x+3, {} 
do-nothing; y = x + 3, {:x=>«2»} 
y X33 {:x=>«2»} 

y 2 4 3, {:Xx=>«2»} 

5, {:x=>?2?} 

do-nothing, {:x=>«2», :y=>«5»} 
=> nil 


Simple 里 重要 但 仍 缺失 的 上 只 有 某 种 无 限制 的 循环 结构 了 ， 所 以 为 了 完成 任务 ， 我 们 引入 
一 个 enhiley 语句 ， 以 便 程序 可 以 执行 任意 次 数 的 重复 计算 ”。 像 while(x < 5) {x = x 
* 3» 这 样 的 语句 ， 包 含 了 一 个 叫 作 条 件 (ex < 5») 的 表达 式 和 一 个 叫 作 语句 主体 (body) 
的 语句 («x = x * 35»)，。 


为 一 个 «while» 语句 写 出 正确 的 规约 规则 需要 一 点 技巧 。 我 们 尝试 着 像 “if， 语句 那样 对 
其 处 理 : 如 果 能 规约 就 对 条 件 进行 规约 ， 不 能 的 话 ， 就 根据 条 件 是 true» 还 是 «false» 相 
应 地 规约 语句 主体 或 者 执行 do-nothing”， 那 下 一 步 会 怎么 样 呢 ? 条 件 已 经 被 规约 成 一 个 
值 或 者 丢弃 了 ， 并 且 语 句 主 体 已 经 被 规约 成 <do-nothing»， 那 么 我 们 如 何 执 行 下 一 周期 的 
循环 呢 ? 每 一 步 规 约 要 想 与 将 来 的 规约 步 又 交流 ， 只 能 通过 产生 一 个 新 的 语句 和 环境 来 实 
现 ， 而 使 用 这 种 方法 ， 我 们 就 没有 地 方 记录 最 初 的 条 件 和 语句 主体 供 下 一 个 循环 使 用 。 


小 步 的 解决 方式 ”是 使 用 序列 语句 把 while 的 一 个 级 别 展 开 ， 把 它 规约 成 一 个 只 执行 一 
次 循环 的 «if» 语句 ， 然 后 再 重复 原始 的 “while”。 这 意味 着 我 们 只 需要 一 个 规约 规则 : 
























































注 9: 使 用 序列 语句 ， 我 们 已 经 能 够 硬 编码 固定 数量 的 重复 操作 了 ， 但 还 是 无 法 控制 运行 时 的 重复 行为 。 
注 10: 我 们 总 试图 把 «while» 的 迭代 行为 直接 构建 成 规约 规则 ， 而 不 是 找到 一 种 途径 让 抽象 机 器 去 处 理 它 ， 
但 这 不 是 小 步 语义 的 工作 方式 。 参考 2.3.2 市 ， 其 中 介绍 的 大 步 语义 是 一 种 让 规则 完成 工作 的 语义 。 
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。 把 «while ( 条件) { 语句 主体 )» 规 约 成 «if ( 条件) { 语句 主体 ; while (条 件 ) 
{ 语句 主体 } } else { do-nothing }» 和 一 个 没有 改变 的 环境 。 


在 Ruby 中 实现 这 个 规则 很 容易 : 


class While < Struct.new(:condition, :body) 
def to_s 
"while (#{condition}) { #{body} }" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
[If.new(condition, Sequence.new(body, self), DoNothing.new), environment] 
end 
end 


这 给 了 虚拟 机 根据 需要 对 条 件 和 语句 主体 进行 求 值 的 机 会 : 


>> Machine.new( 
While.new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


Ed 
{ x: Number.new(1) } 
) .Tun 
while (x < 5) { x = x * 3 }, {:x=>«1»} 
if (x < 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«1»} 
if (1< 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«1»} 
if (true) { x = x * 3; while (x < 5) {x= x*3}}else { do-nothing }, {:x=>«1»} 
x = x*3; while (x < 5) { x= x* 3 }, {:x=>«1»} 
x=1*3; while (x< 5){x= x* 3 }, {:x=>«1»} 
x = 3; while (x < 5) {x * 3 }, {:x=>«1»} 
do-nothing; while (x < 5) 1 x = XxX* 3 }, {:x=>«3»} 
while (x < 5) { x = x * 3 }, {:x=>«3»} 
if (x < 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«3»} 
if (3 < 5) {x= x*3; while (x< 5){x=x*3}}else { do-nothing }, {:x=>«3»} 
if (true) { x = x * 3; while (x < 5) {xXx= x*3}}else { do-nothing }, {:x=>«3»} 
x = x*3; while (x < 5) {x= x* 3 }, {:x=>«3»} 
x=3*3; while (x< 5){x= x* 3 }, {:x=>«3»} 
x = 9; while (x < 5) { x = x * 3 }, {:x=>«3»} 
do-nothing; while (x < 5) { x = x * 3 }, {:x=>«9»} 
while (x < 5) { x = x * 3 }, {:x=>«9»} 
if (x < 5){x= x*3; while (x<5){x 
if (9<5){x= x*3; while (x<5){x 
if (false) {x = x* 3; while (x < 5) {x 
do-nothing, {:x=>«9»} 
a=W 也 


1 


else { do-nothing }, {:x=>«9»} 
else { do-nothing }, {:x=>«9»} 
else { do-nothing }, {:x=>«9»} 


ll 
x xx 
兴 关 关 
wu wu wu 
一 一 一 
-一 一 一 


1 
1 





或 许 这 个 规约 规则 看 起 来 有 点 像 是 在 逃避 一 好像 我 们 总 是 在 往 后 推迟 对 “while 的 规约 ， 
一 直 没 有 实际 进展 一 一 但 它 确实 很 好 地 解释 了 一 个 «while» 语句 真正 的 意思 : 检查 条 件 ， 
对 语句 主体 求 值 ， 然 后 重新 开始 。 奇 怪 的 是 ， 对 «while» 进行 规约 ， 会 把 它 转换 成 一 个 语 
法 上 更 庞大 的 程序 ， 其 中 包括 条 件 语句 和 序列 语句 ， 而 不 是 直接 对 它 的 条 件 和 语句 主体 进 
行规 约 ， 但 有 一 个 能 定义 一 种 语言 形式 语义 的 技术 方案 是 非常 好 的 ， 因 为 我 们 会 更 易 理 解 
这 种 语言 中 的 不 同 部 分 彼此 之 间 是 如 何 关联 的 。 


3. 正确 性 

如 果 程 序 只 是 语法 有 效 但 实际 上 是 错误 的 ， 这 时 按照 我 们 给 出 的 语义 执行 会 发 生 什么 呢 ? 
我 们 之 前 完全 忽视 了 这 一 点 。 语 句 «x = true; x = x + 1» 是 一 段 语法 有 效 的 Simple 代码 ， 
我 们 确实 可 以 构建 一 个 抽象 语法 树 来 表示 它 ， 但 试图 反复 对 其 规约 的 时 候 ， 它 将 会 崩溃 ， 
因为 在 尝试 往 «true» 上 加 «4» 的 时 候 抽 象 机 器 会 终止 。 


























>> Machine.new( 
Sequence .new( 
Assign.new(:x, Boolean.new(true)), 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 


) .run 
x = true; x=x+1, {} 
do-nothing; x = x + 1, {:x=>«true»} 
x = X + 1, {:x=>«true»} 
x = true + 1, {:x=>«true»} 
NoMethodError: undefined method “+' for true:TrueClass 


处 理 这 个 问题 的 一 个 方法 就 是 在 表达 式 能 被 规约 的 时 候 增 加 更 多 的 约束 ， 加 入 对 求 值 失败 
可 能 性 的 考虑 ， 这 时 求 值 过 程 有 可 能 会 中 止 ， 而 不 是 总 要 试图 规约 成 一 个 值 (然后 就 可 能 
在 处 理 过 程 中 崩溃 )。 我 们 本 来 可 以 把 Add#reducible? 实现 成 这 样 ，«+» 的 两 个 参数 要 么 都 
是 可 规约 的 ， 要么 都 是 数字 类 型 (Number) 实例 ， 这 时 它 才 返回 true， 这 种 情况 下 ， 表 达 
式 «true + 1» 将 会 中 止 处 理 而 永远 不 会 变 成 一 个 值 。 























最 终 ， 我 们 需要 一 个 比 语法 更 强大 的 工具 ， 它 要 能 “看 到 未 来 ”并 让 我 们 避免 执行 任何 可 
能 崩溃 或 者 中 止 处 理 的 程序 。 这 一 章 是 关于 动态 语义 (dynamic semantic) 的 一 一 程序 执行 
时 有 具体 在 做 什么 一 一 但 那 并 不 是 一 个 程序 所 拥有 的 唯一 一 种 含义 ; 在 第 9 章 ， 我 们 将 研究 
静态 语义 (static semantic)， 看 看 如 何 根 据 语 言 的 动态 语义 来 判断 一 个 语法 上 有 效 的 程序 
是 否 具 有 有 用 的 含义 。 


4. 应 用 

我 们 定义 的 程序 设计 语言 非常 基本 ， 但 在 写 下 所 有 规约 规则 的 时 候 ， 仍 然 不 得 不 做 了 一 些 
设计 上 的 决策 并 明确 地 表述 它们 。 例 如 ， 与 Ruby 不 同 的 是 ，Simple 这 种 语言 会 区 分 表达 
式 和 语句 ， 前 者 返回 一 个 值 ， 后 者 不 会 返回 值 ， 与 Ruby 相同 的 是 ，Simple 的 环境 只 与 已 




















经 完全 规约 成 值 的 变量 关联 ， 而 不 与 仍然 有 待 执行 的 更 大 表达 式 关联 "。 我 们 可 以 通过 给 
出 不 同 的 小 步 语义 来 改变 上 面 任何 的 策略 ， 这 将 描述 一 种 新 的 语言 ， 这 种 语言 拥有 同样 的 
语法 ,但 有 着 不 同 的 运行 时 行为 。 如 果 向 语言 中 增加 更 多 精心 设置 的 特性 一 一 数据 结构 、 
过 程 调用 、 异 常 和 一 个 对 象 系统 一 一 我 们 需要 做 出 更 多 的 设计 决策 并 在 定义 语义 时 无 歧义 
地 表达 它们 。 

小 步 语 义 的 细节 化 、 面 向 执行 的 风格 能 让 它 无 玻 义 地 定义 真实 世界 的 编程 语言 。 例 如 ， 
Scheme 编程 语言 最 新 的 R6RS 标准 使 用 了 小 步 语 义 (http://www.r6rs.org/final/html/r6rs/ 
r6rs-Z-H-15.html) 描述 其 执行 ， 并 提供 了 PLT Redex 语言 (http://redex.racket-lang.org/) 
(设计 用 来 定义 和 调试 操作 语义 的 一 门 特定 领域 的 语言 ) 对 那些 语义 的 参考 实现 (http:// 
www.r6rs.org/refimpl) 。OCaml 编程 语言 ， 在 一 个 更 简单 的 Core ML 语言 基础 之 上 构建 
了 一 系列 的 分 层 ， 也 有 对 于 基础 语言 运行 时 行为 的 小 步 语义 定义 (http://caml.inria.fr/pub/ 


docs/u3-ocaml/ocaml-ml.html#htoc5 ) 。 








参考 6.2.2 节 ， 那 里 还 有 一 个 小 步 操作 语义 的 例子 ， 它 用 了 一 个 甚至 更 简单 的 叫 作 lambda 
演算 的 编程 语言 定义 了 表达 式 的 含义 。 


2.3.2 大 步 语义 

我 们 已 经 看 到 了 小 步 操作 语义 是 什么 样子 的 : 设计 一 台 抽 象 机 器 维护 一 些 执行 状态 ， 然 后 
定义 一 些 规约 规则 ， 这 些 规 则 详细 说 明了 如 何 才 能 对 每 种 程序 结构 循序 渐进 地 求 值 。 特 别 
地 ， 小 步 语 义 大 部 分 都 带 有 迭代 的 味道 ， 它 要 求 抽 象 机 器 反复 执行 规约 步骤 (Machine#run 
中 的 while 循环 ) ， 这 些 步 又 以 及 与 它们 同样 类 型 的 信息 可 以 作为 自身 的 输入 和 输出 ， 这 让 
它们 适合 这 种 反复 进行 的 应 用 程序 。” 


这 种 小 步 的 方法 有 一 个 优势 ， 就 是 能 把 执行 程序 的 复杂 过 程 分 成 更 小 的 片段 解释 和 分 析 ， 
但 它 确实 有 点 不 够 直接 : 我 们 没有 解释 整个 程序 结构 是 如 何 工 作 的 ， 而 只 是 展示 了 它 是 如 
何 慢 慢 规约 的 。 为 什么 不 能 更 直接 地 解释 一 个 语句 ， 完 整地 说 明 它 的 执行 过 程 呢 ? 好 吧 ， 
我 们 可 以 ， 而 这 正 是 大 步 语 义 (big-step semantic) 的 依据 。 


























大 步 语义 的 思想 是 ， 定 义 如 何 从 一 个 表达 式 或 者 语句 直接 得 到 它 的 结果 。 这 必然 需要 把 程 
序 的 执行 当成 一 个 递归 的 而 不 是 迭代 的 过 程 : 大 步 语 义 说 的 是 ， 为 了 对 一 个 更 大 的 表达 式 
求 值 ， 我 们 要 对 所 有 比 它 小 的 子 表达 式 求 值 ， 然 后 把 结果 结合 起 来 得 到 最 终 答案 。 


在 很 多 方面 ， 这 都 比 小 步 的 方法 更 自然 ， 但 确实 失去 了 一 些 对 细节 的 关注 。 例 如 ， 小 步 语 
义 明确 定义 了 操作 应 该 发 生 的 顺序 ， 因 为 在 每 一 步 都 明确 了 下 一 步 规 约 应 该 是 什么 。 但 是 











注 11: Ruby 的 proc 在 某 种 意义 上 允许 把 复合 表达 式 复制 给 变量 ， 但 是 一 个 proc 仍然 是 一 个 值 : 它 本 身 不 
能 再 执行 任何 求 值 操作 了 ， 但 是 能 和 其 他 值 一 起 作为 一 个 更 大 表达 式 的 一 部 分 进行 规约 。 

注 12: 对 一 个 表达 式 和 一 个 环境 进行 规约 将 得 到 一 个 新 的 表达 式 ， 而 且 下 一 次 还 可 以 重用 有 旧 的 环境 ， 对 一 
个 语句 和 一 个 环境 进行 规约 将 得 到 一 个 新 的 语句 和 一 个 新 的 环境 。 
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大 步 语义 经 常会 写成 更 为 松散 的 形式 ， 只 会 说 哪些 子 计算 会 执行 ， 而 不 会 指明 它们 按 什么 
顺序 执行 。 ”小 步 语义 还 提供 一 种 轻松 的 方式 用 以 监视 计算 的 中 间 阶 段 ， 而 大 步 语 义 只 是 
返回 回 一 个 结果 ， 不 会 产生 任何 关于 如 何 计算 的 证 据 。 


为 了 理解 做 出 的 这 种 权衡 ， 让 我 们 回顾 一 些 常 见 的 语言 结构 ， 并 看 如 何在 Ruby 中 实现 它 
们 的 大 步 语义 。 我 们 的 小 步 语义 要 求 有 一 个 Machine 类 跟踪 状态 并 反复 执行 规约 ， 但 是 这 
里 不 需要 这 个 类 了 ;大 步 规 约 的 规则 描述 了 如 何 只 对 程序 的 抽象 语法 树 访问 一 次 就 计算 
出 整个 程序 的 结果 ， 因 此 不 需要 处 理 状 态 和 重复 。 我 们 将 只 对 表达 式 和 语句 类 定义 一 

#evaluate 方法 ， 然 后 直接 调用 它 。 


1. 表达 式 
处 理 小 步 语义 时 ， 我 们 不 得 不 区 分 像 *1 + 2» 这 样 可 规约 的 表达 式 和 像 3» 这 样 不 可 规约 
的 表达 式 ， 这 样 规约 规则 才能 识别 一 个 子 表 达 式 什么 时 候 可 以 用 来 组 成 更 大 的 程序 。 但 是 
在 大 步 语义 中 ， 每 个 表达 式 都 能 求 值 。 唯 一 的 区 别 ， 如 果 我 们 想 要 有 个 区 别 的 话 ， 就 是 对 
一 些 表达 式 求 值 会 直接 得 到 它们 自身 ， 而 对 另 一 些 表 达 式 求 值 会 执行 一 些 计算 并 得 到 一 个 
不 同 的 表达 式 。 


大 步 语义 的 目标 是 像 小 步 语义 那样 对 一 些 运 行 时 行为 进行 建 模 ， 这 意味 着 我 们 期 望 对 于 每 
一 种 程序 结构 ， 大 步 语义 规则 都 要 与 小 步 语义 规则 程序 最 终生 成 的 东西 保持 一 致 。( 把 操 
作 语 义 写 成 数学 形式 之 后 ， 这 是 能 被 准确 证 明 的 。) 小 步 语义 规则 规定 ， 像 数值 (Number) 
和 布尔 值 (Boolean) 这 样 的 值 不 能 再 规约 了 ， 因 此 它们 的 大 步 规约 非常 简单 : 求 值 的 结果 
直接 就 是 它们 本 身 。 




























































































class Number 
def evaluate(environment) 
self 
end 
end 


class Boolean 
def evaluate(environment) 
self 
end 
end 





变量 (Variable) 表达 式 是 唯一 的 ， 这 样 它们 的 小 步 语义 允许 它们 在 成 为 一 个 值 之 前 只 规约 
一 次 ， 所 以 它们 的 大 步 语 义 规则 与 小 步 规则 一 样 : 在 环境 中 查找 变量 名 然后 返回 它 的 值 。 





class Variable 
def evaluate(environment) 
environment[name] 








注 13: 我 们 用 这 种 方法 实现 的 大 步 语义 不 会 有 二 义 性 ， 因 为 Ruby 本 身 已 经 进行 了 排序 决策 ， 但 是 在 数学 
化 地 定义 大 步 语义 时 ， 就 不 可 避免 地 要 讲 清楚 准确 的 求 值 策 略 了 。 























程序 的 含义 41 


end 
end 





二 元 表达 式 Add、Multiply 和 LessThan 更 有 意思 ， 它 们 要 求 先 对 左右 子 表达 式 递 归 求 值 
然后 再 用 恰当 的 Ruby 运算 合并 两 边 的 结果 值 : 


class Add 
def evaluate(environment) 
Number.new(left.evaluate(environment).value + right.evaluate(environment).value) 
end 
end 





























class Multiply 
def evaluate(environment) 
Number.new(left.evaluate(environment).value * right.evaluate(environment).value) 
end 
end 


class LessThan 
def evaluate(environment) 
Boolean.new(left.evaluate(environment).value < right.evaluate(environment).value) 
end 
end 


为 了 检查 这 些 大 步 的 表达 式 语 义 是 否 正确 ， 下 面 将 在 Ruby 的 控制 台 验 证 一 下 : 


>> Number.new(23).evaluate({}) 
=> «23» 
>> Variable.new(:x).evaluate({ x: Number.new(23) }) 
汪汪 
>> LessThan.new( 

Add.new(Variable.new(:x), Number.new(2)), 

Variable.new(:y) 

).evaluate({ x: Number.new(2), y: Number.new(5) }) 

=> «true» 


2. 语句 

在 我 们 要 定义 语句 的 行为 时 ， 这 种 类 型 的 语义 就 能 发 挥 作用 了 。 在 小 步 语义 下 表达 式 会 规 
约 成 其 他 表达 式 ， 但 语句 会 规约 成 «do-nothing» 并 且 得 到 一 个 经 过 修改 的 环境 。 我 们 可 以 
把 大 步 语义 的 语句 求 值 看 成 一 个 过 程 ， 这 个 过 程 总 是 把 一 个 语句 和 一 个 初始 环境 转 成 一 个 
最 终 的 环境 ， 这 避免 了 小 步 语 义 不 得 不 对 #reduce 产生 的 中 间 语 句 进行 处 理 的 复杂 性 。 例 
如 ， 对 一 个 赋值 语句 按照 大 步 的 方法 求 值 应 该 完整 地 对 其 表达 式 求 值 ， 并 返回 一 个 包含 结 
果 值 的 更 新 了 的 环境 : 
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class Assign 
def evaluate(environment) 
environment.merge({ name => expression.evaluate(environment) }) 
end 
end 


类 似 地 ，DoNothing#evaluate 无 疑 将 把 未 更 改 的 环境 返回 ， 而 If#evaluate 的 工作 相当 地 直 
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接 : 对 条 件 求 值 ， 然 后 把 环境 返回 ， 这 个 环境 来 自 于 对 序列 或 者 替代 语句 求 值得 到 的 结果 。 


class DoNothing 
def evaluate(environment) 
environment 
end 
end 


class If 
def evaluate(environment) 
case condition.evaluate(environment) 
when Boolean.new(true) 
consequence.evaluate(environment) 
when Boolean.new(false) 
alternative.evaluate(environment) 
end 
end 
end 


有 两 种 有 趣 的 情况 就 是 序列 语句 和 “while* 循环 表达 式 。 对 于 序列 ， 我 们 只 需要 对 两 个 语 
句 求 值 ， 但 是 初始 环境 需要 “ 穿 过 ”这 两 个 求 值 过 程 ， 这 样 第 一 个 语句 求 值 的 结果 就 能 成 
为 第 二 个 语句 求 值 的 环境 。 这 可 以 写成 Ruby 代码 : 用 第 一 次 求 值 的 结果 作为 第 二 次 求 值 
的 参数 : 




















class Sequence 
def evaluate(environment) 
second.evaluate(first.evaluate(environment)) 
end 
end 


为 了 让 先前 的 语句 为 后 边 的 做 准备 ,，“ 穿 过 ”环境 是 至 关 重 要 的 : 





>> statement = 
Sequence.new( 
Assign.new(:x, Add.new(Number.new(1), Number.new(1))), 
Assign.new(:y, Add.new(Variable.new(:x), Number.new(3))) 


=> «X=1+1;Yy= XxX+3» 


>> statement.evaluate({}) 
=> {:Xx=>«2», :y=>«5»} 


对 于 «while» 语句 ， 我 们 需要 彻底 想 清楚 对 一 个 循环 完整 求 值 的 各 个 阶段 : 





。 对 条 件 求 值 ， 得 到 «true» 或 者 «false»，; 

。 如 果 条 件 求 值 结果 是 «true»， 就 对 语句 主体 求 值得 到 一 个 新 的 环境 ， 然 后 在 那个 新 的 
环境 下 重复 循环 (也 就 是 说 对 整个 while» 语句 再 次 求 值 )， 最 后 返回 作为 结果 的 环境 ; 

。 如 果 条 件 求 值 结 果 是 “false*， 就 返回 未 修改 的 环境 。 












































这 是 对 一 个 «while» 语句 行为 的 递归 解释 。 就 像 序列 语句 ， 循 环 体 生 成 的 更 新 了 的 环境 被 





下 一 个 迭代 使 用 这 一 点 非常 重要 ， 不然 的 话 ， 条 件 一 直 都 是 true»， 那 么 循环 就 永远 也 没 
有 机 会 停 下 来 了 。” 


知道 了 大 步 «while» 语义 的 行为 表现 之 后 ， 就 可 以 实现 Whiletevaluate 了 : 


class While 
def evaluate(environment) 
case condition.evaluate(environment) 
when Boolean.new(true) 
evaluate(body.evaluate(environment)) ©@ 
when Boolean.new(false) 
environment 
end 
end 
end 


@ 循环 在 这 里 发 生 : body.evaluate(environment) 对 循环 求 值 得 到 一 个 新 的 环境 ， 然 
后 我 们 把 那个 环境 传 回 当 前 方法 中 开始 下 一 次 迭代 。 这 意味 着 可 能 会 堆积 很 多 对 
While#evaluate 的 伦 套 调用 ， 直 到 条 件 最 后 成 为 false 然后 返回 最 后 的 环境 。 

















就 像 任何 递归 代码 一 样 ， 如 果 调 用 内 套 得 太 次 可 能 会 导致 Ruby 调用 栈 溢出 。 
一 一些 Ruby 的 实现 会 实验 性 地 支持 对 尾 调 用 的 优化 ， 这 个 技术 能 通过 尽 可 能 
重用 同样 的 栈 帧 来 减少 溢出 风险 。 在 Ruby 的 官方 实现 (MRI) 里 ， 我 们 可 
以 这 样 打 开 尾 调用 优化 : 

RubyVM: :InstructionSequence.compile option = { 


tailcall optimization: true, 
trace instruction: false 


} 
为 了 确认 生效 ， 可 以 尝试 对 同样 的 «while» 语句 求 值 ， 这 是 之 前 用 来 检查 小 步 语 义 的 : 





























>> statement = 
While.new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


=> «while (x < 5) {xX=x*3}» 
>> statement.evaluate({ x: Number.new(1) }) 


=> {:x=>«9»} 
这 与 小 步 语义 给 出 的 结果 一致， 所 以 看 起 来 Whiletevaluate 做 的 事情 没 错 。 
3. 应 用 





我 们 稍 早 时 候 对 小 步 语 义 的 实现 只 是 适度 使 用 了 Ruby 调用 栈 : 在 对 一 个 大 型 程序 调用 








注 14: 当然 ， 没 有 什么 能 够 阻止 Simple 程序 员 写 出 条 件 永远 也 不 会 为 《false》 的 《while》 语 句 ， 但 如 果 
那 就 是 他 们 想 要 的 ， 那 也 是 可 行 的 。 
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#reduce 时 ， 消 息 会 志 历 抽象 树 直 到 其 到 达 一 段 准 备 好 规约 的 代码 ， 这 会 引起 一 系列 对 
#reduce 的 嵌 套 调用 。 ”但 是 伴随 着 反复 执行 小 步 规 约 ， 虚 拟 机 通过 维护 当前 程序 和 环境 完 
成 了 对 整个 计算 过 程 的 跟踪 ; 值得 一 提 的 是 ， 舱 套 调用 只 是 用 来 壳 历 语法 树 查找 下 一 步 的 
规约 对 象 ， 而 不 是 执行 规约 本 身 ， 因 此 调用 栈 的 深度 受到 程序 语法 树 深度 的 限制 。 


相 比 之 下 ， 大 步 方 式 的 实现 会 执行 较 小 规模 的 计算 ， 并 将 其 作为 更 大 规模 计算 的 一 部 分 。 
为 了 跟踪 还 有 多 少 求 值 工作 要 做 ， 它 使 用 了 更 多 的 栈 ， 并 完全 依赖 栈 来 记 住 当前 处 理 在 整 
个 计算 中 的 位 置 。 看 上 去 像 是 对 #evaluate 的 一 次 调用 ， 实 际 上 转换 成 了 一 系列 递归 调用 ， 
每 一 次 调用 都 对 一 个 子 程序 求 值 ， 这 都 让 其 在 语法 树 中 更 进一步 。 











这 个 差别 突出 了 每 一 种 方法 的 目的 。 小 步 语 义 设 定 了 一 台 能 执行 小 操作 的 简单 抽象 机 器 ， 
因此 它 包含 了 关于 如 何 产 生 有 用 中 间 结 果 的 详尽 细 方 ， 大 步 语义 把 汇编 整个 计算 的 重担 交 
给 了 机 器 或 者 执行 它 的 人 ， 在 仅 通过 一 步 操作 就 把 整个 程序 转换 成 一 个 最 终结 果 的 过 程 
中 ， 要 求 它 跟踪 许多 中 间 子 目标 。 根 据 我 们 想 用 一 个 语言 的 操作 语义 干什么 一 一 或 是 构建 
一 个 高 效 的 实现 ， 证 明 程序 的 某 些 属性 ， 或 是 设计 某 个 最 佳 变换 一 一 可 能 采用 其 中 一 种 方 
法 或 者 另 一 种 方法 会 更 合适 。 

















大 步 语 义 在 定义 真正 程序 设计 语言 上 最 有 影响 的 应 用 是 第 6 章 提 到 的 标准 ML 编程 语言 
(http:Wwww.lfcs.infed.ac.ukreports/87/ECS-LFCS-87-36/) 的 原始 定义 ， 它 用 大 步 方 式 定 义 
了 ML 的 所 有 运行 时 行为 。 在 这 个 例子 之 后 ，OCam 的 核心 语言 用 大 步 语 义 (http://caml. 
inria.fr/pub/docs/u3-ocaml/ocaml-ml.html#htoc7) 补足 了 它 更 细节 的 小 步 定义 。 





W3C 也 用 到 了 大 步 操作 语义 : XQuery 1.0 和 XPath 2.0 规范 (http://www.w3.org/TR/xquery- 
semantics/) 使 用 数学 化 的 推理 规则 描述 它 的 语言 应 该 如 何 求 值 ， 并 且 XQuery 和 XPath 规 
范 全 文 的 3.0 版 本 (http://www.w3.org/TR/xpath-full-text-30/) 包括 了 一 个 使 用 XQuery 写成 
的 大 步 语义 。 


你 可 能 注意 到 了 ， 通 过 使 用 Ruby 语言 而 不 是 数学 语言 写 下 Simple 的 小 步 和 大 步 语 义 ， 我 
门 已 经 为 它 实 现 了 两 个 不 同 的 Ruby 解释 器 。 操 作 语 义 实质 上 是 这 样 的 : 通过 描述 一 个 解 
析 器 来 说 明 一 种 语言 的 含义 。 正 常情 况 下 ， 这 个 描述 应 该 用 简单 的 数学 符号 来 写 ， 只 要 我 
门 能 理解 ， 这 将 使 一 切 都 清晰 而 且 无 歧义 ， 但 是 这 样 过 于 抽象 而 且 离 现实 中 的 计算 机 有 一 
定 距离 。 把 一 种 真实 世界 编程 语言 的 额外 复杂 性 〈 类 、 对 象 、 方 法 调用 ……) 引入 到 本 该 
简约 的 说 明 当 中 ， 这 是 Ruby 语言 的 缺点 ， 但 是 如 果 我 们 已 经 理解 Ruby， 那 么 就 更 容易 理 
解 整 个 过 程 ， 并 且 能 够 执行 的 描述 可 以 当 作 一 个 解释 器 ， 这 是 个 很 好 的 红利 。 















































注 15: 有 一 种 操作 语义 的 替换 形式 ， 叫 作 规约 语义 ， 它 通过 引入 所 谓 的 规约 上 下 文 ， 把 “下 一 步 规约 什么 ” 
和 “如 何 对 其 进行 规约 ”分 离开 来 。 这 些 上 下 文 只 是 一 些 简 明 描述 了 规约 在 程序 中 何 处 发 生 的 模式 。 
这 意味 着 我 们 只 需要 写真 正 执行 计算 的 规约 规则 ， 从 而 把 一 些 样板 文件 (boilerplate) 从 更 大 型 的 语 
言 中 去 掉 。 

















2.4 指称 语义 


到 目前 为 止 ， 我 们 已 经 从 操作 性 方面 观察 了 程序 设计 语言 的 含义 ， 它 通过 展示 程序 执行 之 
后 发 生 的 事情 解释 了 程序 的 含义 。 而 指称 语义 (denotational semantic) 转 而 关心 从 程序 本 
来 的 语言 到 其 他 表示 的 转换 。 


这 种 类 型 的 语义 没有 直接 处 理 程序 的 执行 ， 而 是 关注 如 何 借助 另 一 种 语言 的 已 有 含义 一 一 
一 种 低级 的 、 更 形式 化 的 或 者 至 少 比 正在 描述 的 语言 更 好 理解 的 语言 一 一 解释 一 个 新 的 


语言 。 





















































指称 语义 确实 是 一 种 比 操作 语 义 更 抽象 的 方法 ， 因 为 它 只 是 用 一 种 语言 替换 另 一 种 语 
言 ， 而 不 是 把 一 种 语言 转换 成 真实 的 行为 。 例 如 ， 如 果 我 们 需要 向 一 个 人 解释 英语 动词 
“walk” 的 含义 ， 但 和 他 没有 共同 的 口头 语言 ， 可 以 通过 来 回 走 的 动作 来 沟通 。 另 一 方面 ， 
如 果 我 们 需要 向 一 个 说 法 语 的 人 解释 “walk”， 可 以 跟 他 讲 “marcher” 不 可 否认 这 是 
一 种 更 高 层次 的 沟通 方式 ， 不 需要 麻烦 地 运动 了 。 


指称 语义 通常 用 来 把 程序 转 成 数学 化 的 对 象 ， 所 以 不 出 意料 ， 可 以 用 数学 工具 研究 和 控制 
它们 ， 但 是 我 们 可 以 看 看 如 何 用 另 一 种 方式 表示 Simple 程序 ， 借 此 大 致 了 解 指称 语义 。 
































把 Simple 转 成 Ruby 从 而 得 到 Simple 语言 的 指称 语义 , “事实 上 ， 这 意味 着 把 一 个 抽象 语 
法 树 转 成 一 个 Ruby 代码 的 字符 串 。 不 管 怎样 ， 我 们 得 到 了 那 种 语法 本 来 的 含义 。 


但 “本 来 的 含义 ”是 什么 呢 ? 我 们 表达 式 和 语句 的 Ruby 指称 (denotation) 是 什么 样 的 
呢 ? 从 操作 上 我 们 已 经 看 到 一 个 表达 式 使 用 一 个 环境 (environment) 然后 把 它 转 成 一 个 
值 ， 在 Ruby 中 表达 这 个 过 程 的 一 种 方式 是 用 一 些 参数 表示 环境 参数 ， 然 后 返回 一 些 表 示 
值 的 Ruby 对 象 。 对 于 像 «5» 和 «false» 这 样 简单 的 常量 表达 式 ， 我 们 根本 无 需 使 用 环境 ， 

只 需要 关心 它们 最 终 的 结果 如 何 能 表示 成 一 个 Ruby 对 象 。 幸 运 的 是 ，Ruby 已 经 设计 了 
专门 的 对 象 表示 这 些 值 : 我 们 可 以 使 用 Ruby 值 5 作为 Simple 表达 式 «5» 的 结果 ， 同 样 地 ， 
把 Ruby 的 值 false 作为 «false» 的 结果 。 


























2.4.1 表达 式 
我 们 可 以 用 这 个 思想 为 Number 类 和 Boolean 类 写 一 个 批 o_ruby 的 实现 : 


class Number 


def to ruby 
"-> e { #{value.inspect} }" 
end 
end 





注 16: 这 意味 着 我 们 将 用 Ruby 代码 生成 Ruby 代码 ， 但 是 选择 用 同样 的 指称 语言 和 实现 元 语言 只 是 为 了 让 
事情 简单 。 例 如 我 们 很 容易 用 Ruby 写 出 能 生成 包含 JavaScript 字符 串 的 代码 来 。 
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class Boolean 
def to ruby 
"-> e { #{value.inspect} }" 
end 
end 


下 面 在 控制 台 运 行 它们 : 


>> Number.new(5).to ruby 

=> "->e{5}" 

>> Boolean.new(false).to_ruby 
=> "-> e { false }" 














这 些 方 法 每 个 都 产生 一 个 刚好 包含 Ruby 代码 的 字符 串 ， 并 且 因 为 Ruby 是 一 种 我 们 已 经 理 
解 其 含义 的 语言 ， 所 以 可 以 看 到 这 些 字符 串 都 是 构造 proc 的 程序 。 每 一 个 proc 都 带 有 一 
个 叫 e 的 环境 参数 ， 它 们 完全 忽略 这 个 参数 而 直接 返回 一 个 Ruby 值 。 


因为 这 些 符号 都 是 Ruby 代码 组 成 的 字符 串 ， 所 以 可 以 使 用 Kernel#eval 转换 成 可 调用 的 
Proc 对 象 实际 执行 ， 然 后 在 IRB 中 检查 它们 的 行为 ”: 








T 








>> proc = eval(Number.new(5).to ruby) 

=> #<Proc (lambda)> 

>> proc.call({}) 

=> 5 

>> proc = eval(Boolean.new(false).to_ruby) 
=> #<Proc (lambda)> 

>> proc.call({}) 

=> false 





现 阶段 ， 完 全 和 避免 proc， 而 使 用 更 简单 的 六 0_ruby 实现 是 很 诱 人 的 ， 这 只 
一 人》 需要 把 Nunber.new(5) 转换 成 字符 串 '5' 而 不 是 '-、e {5}' 等 ， 但 是 从 源 语 
过 结构 中 获得 其 本 质 语 义 是 指称 语义 这 一 方法 的 一 部 分 ， 那 么 我 们 需要 知 
道 ， 即 便 某 些 特定 的 表达 式 不 会 用 到 环境 ， 通 常 的 表达 式 也 还 是 需要 一 个 环 
境 的 。 














为 了 表示 确实 使 用 环境 的 表达 式 ， 我 们 需要 决定 如 何 用 Ruby 表示 环境 (environment)。 在 研 
究 操 作 语 义 时 我 们 已 经 了 解 了 环境 ， 那 么 既然 它们 已 经 用 Ruby 实现 了 ， 现 在 可 以 重用 早期 
的 思想 一 一 把 一 个 环境 表示 成 一 个 散 列表 。 不 过 细 刷 需要 做 一 些 改动 ， 因 此 要 注意 其 中 微妙 
的 差别 : 在 我 们 的 操作 语义 中 ， 环 境 是 生存 在 虚拟 机 中 的 ， 并 且 把 变量 名 与 Number.new(5) 
这 样 的 Simple 抽象 语法 树 联 系 起 来 ， 但 在 我 们 的 指称 语义 中 ， 环 境 存在 于 我 们 要 把 
程序 转换 得 到 的 语言 中 ， 因 此 要 在 那个 世界 而 不 是 在 一 个 虚拟 机 的 “外 部 世界 ”起 
作用 。 











注 17: 只 有 Ruby 既 做 实现 语言 又 作为 指称 语言 的 时 候 我 们 才能 这 么 做 。 如 果 指 称 是 JavaScript 源 代码 ， 我 
们 就 得 到 JavaScript 的 控制 台 去 实验 它们 了 。 








注意 ， 这 意味 着 指称 环境 (denotational environment) 应 该 把 变量 名 与 5 这 样 的 原生 Ruby 
值 ， 而 不 是 与 表示 Simple 语法 的 对 象 关联 起 来 。 我 们 把 { x: Number.new(5) } 这 样 的 操作 环 
境 (operational environment) 看 成 在 要 转换 成 的 语言 中 拥有 指称 '{ x: 5 }'"， 并且 因为 实现 
的 元 语言 和 指称 语言 正好 都 是 Ruby， 所 以 不 必 有 什么 顾 蕊 。 





既然 知道 环境 将 是 一 个 散 列 ， 那 么 就 可 以 实现 Variable#to_ruby 了 : 


class Variable 


def to ruby 
"-> e { el#{name.inspect}] }" 
end 
end 


这 段 代 码 ， 把 一 个 变量 表达 式 转 换 成 一 个 在 环境 散 列 中 查找 合适 值 的 Ruby proc: 


>> expression = Variable.new(:x) 
=> «XxX» 

>> expression.to ruby 

=> "->e { ef:x] }" 

>> proc = eval(expression.to ruby) 
=> #<Proc (lambda)> 

>> proc.call({ x: 7 }) 

=> 7 


关于 指称 语义 重要 的 一 点 是 它 是 组 合式 的 : 一 个 程序 的 指称 由 组 成 它 的 各 部 分 的 指示 构 
成 。 在 开始 指称 (denotating) Add、Multiply 和 LessThan 这 样 的 更 大 表达 式 时 ， 我 们 就 能 
理解 这 种 合成 性 了 : 

















class Add 
def to ruby 
"-> e { (#{left.to ruby}).call(e) + (#{right.to ruby}).call(e) }" 
end 
end 


class Multiply 


def to ruby 
"-> e { (#{left.to ruby}).call(e) * (#{right.to ruby}).call(e) }" 
end 
end 


class LessThan 


def to ruby 
"-> e { (#{left.to ruby}).call(e) < (#{right.to ruby}).call(e) }" 
end 
end 


这 里 使 用 字符 串 串 联 操作 把 子 表达 式 的 指称 组 成 一 个 大 表达 式 的 指称 。 我 们 知道 每 一 个 子 
表达 式 都 将 在 Ruby 源码 中 用 一 个 proc 表示 ， 因 此 可 以 将 它们 作为 更 大 段 Ruby 代码 的 一 
部 分 ， 那 些 更 大 段 的 代码 使 用 提供 的 环境 调用 这 些 proc， 并 使 用 它们 返回 的 值 进行 一 些 计 
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下 面 是 得 到 结果 : 











>> Add.new(Variable.new(:x), Number.new(1)).to ruby 

=> "->e{ (->e {el:x] }).call(e) + (->e {1}).call(e) }" 

>> LessThan.new(Add.new(Variable.new(:x), Number.new(1)), Number.new(3)).to ruby 

= > "->e{(->e{(->e{ el:x] }).call(e) + (-> e { 1 }).call(e) }).call(e) < (->ef{ 
3 }).call(e) }" 





这 些 指称 已 经 够 复杂 的 了 ， 很 难 了 解 它们 做 的 事情 是 否 正 确 。 让 我 们 运行 它们 确认 一 下 : 


>> environment = { x: 3 } 
=> {:x=>3} 
>> proc = eval(Add.new(Variable.new(:x), Number.new(1)).to ruby) 
=> #<Proc (lambda)> 
>> proc.call(environment) 
=> 4 
>> proc = eval( 
LessThan.new(Add.new(Variable.new(:x), Number.new(1)), Number.new(3)).to ruby 


=> #<Proc (lambda)> 
>> proc.call(environment) 
=> false 


2.4.2 ”语句 

我 们 可 以 用 类 似 的 方式 定义 语句 的 指称 语义 ， 但 是 要 记 住 操作 语义 中 提 到 的 对 一 个 语句 
求 值 产生 的 是 一 个 新 的 环境 而 不 是 一 个 值 。 这 意味 着 Assign#to_ruby 需要 为 proc 构造 一 
些 人 代码， 以 使 结果 是 一 个 更 新 了 的 环境 散 列 : 

















class Assign 


def to ruby 
"-> e { e.merge({ #{name.inspect} => (#{expression.to ruby}).call(e) }) }" 
end 
end 


还 是 可 以 在 控制 台 对 其 进行 检查 : 


>> statement = Assign.new(:y，Add.new(Variable.new(:x)，Number.new(1))) 

=>kY = X + 1» 

>> statement.to ruby 

=> "-> ef e.merge({ :y => (->e { (->e { e[:x] }).call(e) + (->e { 1 }).call(e) }) 
.call(e) }) }" 

>> proc = eval(statement.to ruby) 

=> #<Proc (lambda)> 

>> proc.call({ x: 3 }) 

=> {:x=>3, :y=>4} 


和 之 前 一 样 ，DoNothing 的 语义 非常 简单 








class DoNothing 
def to ruby 





'->e{fey' 
end 
end 


对 于 条 件 语句 ， 我 们 可 以 把 Simple 的 cif (.…) { .… } else { ...}» 转换 成 一 个 Ruby 
的 if ... then ... else ...end， 确 保 环 境 传 到 了 需要 它 的 地 方 : 


class If 
def to ruby 
"-> e { if (#{condition.to ruby}).call(e)" + 
" then (#{consequence.to ruby}).call(e)" + 
" else (#{alternative.to ruby}).call(e)" + 
”end }" 
end 
end 


就 像 在 大 步 操作 语义 中 一 样 ， 我 们 需要 小 心地 定义 序列 语句 : 对 第 一 个 语句 求 值 的 结果 作 
为 对 第 二 个 语句 求 值 时 的 环境 。 





class Sequence 


def to ruby 
"-> e { (#{second.to ruby}).call((#{first.to ruby}).call(e)) }" 
end 
end 














最 后 ， 就 像 处 理 条 件 语 名 那样 ， 我 们 可 以 把 «while» 语句 转 成 proc， 在 返回 最 终 环境 之 前 ， 
它 使 用 Ruby 的 while 重复 执行 语句 主体 : 








class While 
def to ruby 
"->e{"+ 
" while (#{condition.to ruby}).call(e); e = (#{body.to ruby}).call(e); end;" + 
"e"+ 
Ll + Ll 
end 
end 





哪怕 是 一 个 简单 的 «while» 都 具有 一 个 元 长 的 表示 ， 所 以 有 必要 用 Ruby 解释 器 检查 一 下 
它 的 含义 正确 与 否 : 





>> statement = 
While.new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


) 
=> «while (x < 5) {xX=x*3}» 
>> statement.to ruby 
=> "-> e { while (->e { (-> e { e[:x] }).call(e) < (-> e { 5 }).call(e) }).call(e); 
e=(->e { e.merge({ :x => (-> e { (-> e { e[:x] }).call(e) * (-> e { 3 }).call(e) 
}).call(e) }) }).call(e); end; e }" 
>> proc = eval(statement.to_ruby) 
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=> #<Proc (lambda)> 
>> proc.call({ x: 1 }) 
=> {:x=>9} 





语义 类 型 比较 
«while» 是 一 个 区 分 小 步 语义 、 大 步 语义 和 指称 语义 的 好 例子 。 


«while» 的 小 步 操作 语义 是 以 一 台 抽 象 机 器 的 归 约 规则 形式 写成 的 。 整 个 循环 并 不 是 规 
约 行为 的 一 部 分 一 一 规约 只 是 把 一 个 «while» 语句 转 成 一 个 kif» 语 向 但 是 它 会 作 
为 将 来 由 机 器 执行 的 规约 序列 的 一 部 分 。 为 了 理解 ewhile» 做 了 什么 ,我们 需要 考虑 
所 有 的 小 步 规 则 ， 并 弄 懂 随 着 一 个 Simple 程序 的 执行 它们 之 间 是 如 何 互 相 作 用 的 。 


«while» 的 大 步 操作 语义 是 以 一 个 求 值 规则 的 形式 写成 的 ， 这 个 规则 说 明 如 何 把 最 终 的 
环境 直接 计算 出 来 。 这 个 规则 包含 了 对 其 本 身 的 递归 调用 ， 因 此 明显 表明 swhiley 在 
求 值 过 程 中 会 引发 一 个 循环 ， 但 不 是 Simple 程序 员 束 悉 的 那 种 循环 。 大 步 的 规则 是 递 
归 的 形式 ， 描 述 了 如 何 根据 对 其 他 语法 结构 的 求 值 对 一 个 表达 式 或 者 语句 完整 地 求 值 ， 
因此 这 个 规则 告诉 我 们 ， 对 一 个 «while» 语句 求 值 的 结果 可 能 会 依赖 于 一 个 不 同 环境 
下 同样 语句 的 求 值 结果 ， 但 把 这 种 思想 与 while» 应 该 展现 的 选 代 方 式 联系 起 来 需要 
跳跃 性 思维 。 盏 运 的 是 这 种 跳跃 并 不 太 大 : 一 点 点 的 数学 推理 可 以 表明 两 种 类 型 的 特 
环 在 本 质 上 是 等 价 的 ， 并 且 在 元 语言 支持 尾 调用 优化 的 时 候 ， 它 们 事实 上 也 是 等 价 的 。 


«While» 的 指称 语义 展示 了 如 何 用 Ruby 对 其 重 写 ， 也 就 是 如 何 通过 Ruby 的 while 关 
键 字 对 其 重 写 。 这 是 一 个 简单 直接 得 多 的 转换 : Ruby 提供 对 选 代 循 环 的 原生 支持 ， 而 
指称 规则 也 表明 “while” 能 用 Ruby 的 这 个 特性 实现 。 要 理解 这 两 种 类 型 的 循环 没有 
什么 困难 ， 所 以 如 果 我 们 理解 了 Ruby 中 while 循环 的 工作 方式 ， 也 能 理解 Simple 的 
«while» 循环 。 当 然 ， 这 意味 着 我 们 已 经 把 理解 Simple 的 问题 转换 成 了 理解 指称 语言 
的 问题 ， 而 如 果 指 称 语言 像 Ruby 一 样 庞大 而 且 定 义 不 良 ， 这 就 是 一 个 严重 的 缺点 ; 
但 在 有 一 个 能 用 来 写 指 称 的 小 型 数学 语言 时 ， 这 就 成 了 一 个 优点 。 

















2.4.3 应 用 

做 完 所 有 这 些 工 作 之 后 ， 指 称 语 义 完 成 了 什么 目标 呢 ? 它 的 主要 目的 是 展示 如 何 把 Simple 
翻译 成 Ruby， 它 将 后 者 作为 工具 来 解释 不 同 的 语言 结构 是 什么 意思 。 这 恰巧 给 了 我 们 执 
行 Simple 程序 的 一 种 途径 一 一 因为 已 经 用 可 执行 的 Ruby 写 下 了 指称 语义 的 规则 ， 而 且 
这 些 规 则 的 输出 本 身 就 是 可 执行 的 Ruby 一 一 但 这 只 是 偶然 事件 ， 因 为 我 们 之 前 有 可 能 

普通 的 英语 写 规则 并 用 一 些 数学 语言 写 下 指称 。 真 正 重要 的 是 我 们 自己 随意 设计 了 一 种 语 
言 ， 并 把 它 转换 成 一 种 其 他 人 或 者 其 他 东西 能 理解 的 语言 。 









































为 了 赋予 这 种 转换 一 些 解释 能 力 ， 把 一 部 分 语言 含义 放 到 表面 而 不 再 只 是 隐 含 在 背后 会 非 
常 有 帮助 。 例 如 ， 这 种 语义 把 环境 表示 成 具体 的 Ruby 对 象 一 在 proc 中 传人 和 返回 的 散 








列 ， 而 不 是 把 Simple 中 的 变量 表示 成 真正 的 Ruby 变量 ， 然 后 依赖 Ruby 自己 微妙 的 变量 作 
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用 域 规则 去 定义 Simple 的 变量 访问 机 制 ， 这 样 表示 环境 更 为 明确 直接 。 在 这 方面 这 种 语义 
除了 把 解释 性 的 工作 交 给 Ruby， 还 多 做 了 一 些 事情 ， 它 把 Ruby 作为 一 个 简单 的 基础 ， 但 
是 在 表面 做 了 一 些 额外 的 工作 ， 从 而 准确 地 展示 了 不 同 程序 结构 是 如 何 使 用 和 改变 环境 的 。 


这 之 前 我 们 看 到 过 ， 操 作 语义 通过 为 一 种 语言 设计 一 个 解释 器 来 解释 这 种 语言 的 含义 。 与 
此 对 比 ， 语 言 到 语言 的 指称 语义 更 像 是 一 个 编译 器 : 在 这 种 情况 下 ， 我 们 的 楷 o_ruby 实现 
高 效 地 把 Simple 编译 成 Ruby。 这 些 类 型 的 语义 虽然 都 对 如 何 为 一 种 语言 高 效 地 实现 一 个 
解释 器 或 者 编译 器 只 字 不 提 ， 但 确实 提供 了 一 个 基础 标准 可 以 检验 任何 生效 了 的 实现 。 





























这 些 指 称 的 定义 还 在 一 些 语言 的 原始 状态 中 出 现 过 。 早 期 版 本 的 Scheme 标准 使 用 指称 
语 义 (http://www.schemers.org/Documents/Standards/R5RS/HTML/r5rs-Z-H-10.html#%25_ 
sec_7.2) 定义 核心 语言 ， 而 不 像 现 在 的 标准 使 用 小 步 操作 语义 来 定义 ， 并 且 XSLT 文本 转 
换 语言 的 开发 是 由 Philip Wadler 对 XSLT 模式 (http://homepages.inf/ed.ac.uk/wadler/topics/ 
xml.html#xsl-semantics) 和 XPath 表达 式 (http://homepages.inf.ed.ac.uk/wadler/topics/xml. 
html#xpath-semantics) 的 指称 定义 来 引导 的 。 








3.3.2 市 有 一 个 实际 使 用 指称 语义 定义 正则 表达 式 的 例子 。 


二 全 及 re 3 
2.5 形式 化 语义 实践 
对 于 为 计算 机 程序 赋予 含义 的 问题 ， 本 章 已 经 展示 了 几 种 不 同 的 方法 。 在 每 种 情况 下 ， 我 
们 都 已 经 避免 了 数学 化 的 方法 并 使 用 Ruby 了 解 了 它们 的 策略 ， 但 是 形式 化 的 语义 通常 都 
是 由 数学 化 的 工具 完成 的 。 








2.5.1 形式 化 

我 们 对 形式 语义 的 研究 并 不 是 特别 正式 。 一 直 没 有 认真 关注 过 数学 符号 ， 而 使 用 Ruby 作 
为 元 语言 意味 着 比 起 理解 程序 的 各 种 方式 ， 我 们 更 关注 执行 程序 的 不 同方 式 。 合 适 的 指称 
语义 关注 的 是 通过 把 程序 转换 成 定义 良好 的 数学 对 象 以 获得 程序 的 核心 含义 ， 关 心 的 是 把 
一 个 Simple 的 «while» 语句 无 歧义 的 完整 表示 成 一 个 Ruby 的 while 循环 。 

















为 了 提供 对 指称 语义 有 用 的 定义 和 对 象 ， 专 门 发 展 了 称 为 域 理论 的 数学 分 
， 它 采用 基于 单调 函数 上 不 动 点 的 一 种 计算 模型 ， 并 且 这 个 单调 函数 定义 
”在 偏 序 集合 上 。 我 们 可 以 通过 把 程序 “编译 ”成 数学 函数 来 理解 这 个 程序 ， 

并 且 域 理论 的 技巧 还 能 用 来 证 明 这些 函 数 一 些 有 趣 的 特性 。 





















































































































































另 一 方面 ， 尽 管 我 们 只 是 用 Ruby 含糊 地 概括 了 一 下 指称 语义 ， 但 关于 操作 语义 ， 我 们 已 
经 在 精神 上 接近 它 的 形式 化 表示 了 : 我 们 对 方法 #7reduce 和 #evaluate 的 定义 实际 上 只 是 
用 Ruby 翻译 的 数学 化 推理 规则 。 
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2.5.2 ”找到 含义 

形式 化 语义 的 一 个 重要 应 用 是 为 一 种 编程 语言 的 含义 给 出 一 个 无 歧义 的 定义 ， 而 不 是 让 其 
依赖 于 像 自 然 语言 规范 文档 和 “由 实现 规范 ”这 样 更 加 随意 的 方法 。 形 式 化 的 定义 还 有 其 
他 用 途 ， 例 如 证 明 某 种 语言 通常 情况 下 的 特性 ， 以 及 特定 程序 在 特定 情况 下 的 特性 ， 证 明 
语言 中 程序 之 间 的 等 价 性 ， 研 究 如 何在 不 改变 程序 行为 的 情况 下 安全 地 变换 程序 而 使 其 效 


率 更 高 。 


例如 ， 既 然 操 作 语义 与 解释 器 的 实现 极为 接近 ， 那 么 计算 机 科学 家 就 可 以 把 一 个 适当 的 解释 
器 看 成 一 种 语言 的 操作 语义 ， 然 后 证 明 它 在 那 种 语言 的 指称 语义 方面 的 正确 性 一 一 这 意味 着 
证 明了 由 解释 器 给 出 的 含义 和 由 指称 语义 给 出 的 含义 之 间 存 在 着 明显 的 联系 。 


指称 语义 的 一 个 优点 是 比 操作 语义 抽象 层次 更 高 ， 它 忽略 了 程序 如 何 执行 的 细节 ， 而 只 
心 如 何 把 它 转换 成 一 个 不 同 的 表示 。 例 如 ， 如 果 存 在 一 种 指称 语义 可 以 把 两 种 语言 翻译 成 
某 种 共通 的 表示 ， 就 使 对 不 同 语言 写成 的 两 个 程序 进行 比较 成 为 可 能 。 


抽象 程度 会 使 指称 语义 看 起 来 有 点 忽 围 子 。 如 果 问 题 是 如 何 解 释 一 种 程序 设计 语言 的 含 
义 ， 那 么 把 一 种 语言 翻译 成 另 一 种 语言 是 如 何 让 我 们 更 接近 问题 答案 的 呢 ? 一 个 指称 只 不 
过 与 它 的 含义 一 样 好 ;尤其 是 ， 如 果 指 称 的 语言 有 某 种 操作 性 的 含义 ， 那 么 一 个 指称 语义 
只 是 让 我 们 更 接近 于 能 实际 执行 一 个 程序 ， 这 个 语言 的 语义 本 身 展示 了 它 是 如 何 执行 的 ， 
而 不 是 如 何 翻 译 成 另 一 种 语言 的 。 


形式 化 的 指称 语义 使 用 抽象 的 数学 对 象 (通常 是 函数 ) 来 表示 表达 式 和 语句 这 样 的 编程 语 
言 结 构 ， 并 且 因 为 数学 上 的 约定 会 规定 如 何 对 函数 求 值 这 样 的 事情 ， 这 就 有 了 一 种 直接 在 
操作 意义 上 思考 指称 的 方式 。 我 们 已 经 使 用 了 不 太 正 式 的 方式 ， 把 指称 语义 看 成 是 一 种 语 
言 到 另 一 种 语言 的 编译 器 ， 而 事实 上 这 是 多 数 编程 语言 最 终 得 以 执行 的 方式 : 一 个 Java 程 
序 将 会 由 javac 编译 成 字 节 码 ， 字 节 码 将 会 被 java 的 虚拟 机 即时 编译 成 x86 的 指令 ， 然 后 
一 个 CPU 会 把 每 一 条 x86 指令 解码 成 类 RISC (精简 指令 集 ) 的 微 指令 放 到 一 个 核 上 去 执 
行 …… 它 会 在 什么 地 方 结束 呢 ? 是 编译 器 ， 还 是 虚拟 机 ， 还 是 一 直 重 复 下 去 ? 


当然 程序 最 终 会 执行 ， 因 为 语义 这 个 高 楼 会 到 达 底 部 暴露 出 实际 的 机 器 : 半导体 中 的 电 
子 ， 它 们 遵守 的 是 物理 法 则 。" 一 台 计 算 机 是 维护 这 个 不 确定 结构 的 装置 ， 大 量 复杂 的 解 
释 层 在 彼此 之 上 保持 稳定 平衡 ， 这 就 允许 多 点 触 控 手势 这 样 人 体 尺度 的 想法 和 while 循环 
这 样 的 想法 ， 都 能 被 逐渐 地 向 下 翻译 给 硅 和 电 的 物理 世界 。 

































































2.5.3 备 选 方案 
本 章 你 已 经 看 到 了 许多 不 同名 称 的 语义 类 型 。 小 步 语义 还 叫 结构 化 操作 语义 (structural 





注 18: 或 者 ， 在 Charles Babbage 设计 的 分 析 机 这 种 机 械 计算 机 的 场景 下 ， 是 齿轮 和 纸 遵 守 物 理 规律 。 














operational semantic) 和 转换 语义 (transition semantic) ; 大 步 语义 更 普遍 的 叫 法 是 自然 语 
义 (natural semantic) 或 者 关联 语义 (relational semantic) ; 而 指称 语义 还 可 以 称 为 不 动 点 


语义 (fixed-point semantic) 或 者 数学 语义 (mathematical semantic ) 。 


还 有 其 他 类 型 的 形式 语义 可 用 。 甚 中 一 个 就 是 公理 化 语义 (axiomatic semantic) ， 它 通过 在 
语句 执行 前 后 分 别 给 出 抽象 机 器 状态 的 断言 来 描述 一 个 语句 的 含义 : 如 果 一 个 断言 (前 置 
条 件 ) 在 语句 执行 前 初始 是 true， 那 么 随后 的 其 他 断言 (后 置 条 件 ) 将 是 true。 公 理化 
语义 在 验证 程序 的 正确 性 方面 很 有 用 : 随 着 语句 合 到 一 起 组 成 更 大 的 程序 ， 它 们 对 应 的 断 
言 也 能 合 到 一 起 组 成 更 大 的 断言 ， 其 目标 就 是 表明 对 一 个 程序 总 体 的 断言 与 它 的 预期 定义 
匹配 。 





虽然 细节 有 所 不 同 ， 但 是 公理 化 语义 是 描述 RubySpec project 最 好 的 语义 类 型 ，RubySpec 
project (http://www.rubyspec.org) 是 “Ruby 程序 设计 语言 的 可 执行 规范 ”， 它 使 用 RSpec 
类 型 的 断言 既 描 述 Ruby 的 核心 以 及 标准 库 ， 又 描述 Ruby 内 置 语言 结构 的 行为 。 例 如 ， 下 


而 是 RubySpec 描述 Array#k< 方法 的 片段 : 

















describe "Array#<<" do 
it "correctly resizes the Array" do 


.Size.should == 0 
<x :foo 

.Size.should == 1 
<x :bar << :baz 
.Size.should == 3 


ov VY VY VY 


a [1， 2， 3] 
.Shift 

shift 

.Shift 

«x :foo 

.Should == [:foo] 


CoOODOODOODO DOD VY 


en 
end 


sh 由 :五 、 9 

2.6 ”实现 语法 解析 器 

本 章 ， 我 们 已 经 手工 构建 了 Simple 程序 的 抽象 语法 树 一 一 通过 手写 Assign.new(:x， Add. 
new(Variable.new(:x)， Number.new(1))) 这 样 的 普通 Ruby 表达 式 ， 而 不 是 先 写 'x = x + 
1' 这 样 原始 的 Simple 源 代码 ， 然 后 使 用 一 个 语法 解析 器 自动 地 把 它 转 成 语法 树 。 

从 头 开 始 完整 地 实现 一 个 Simple 的 语法 解析 器 过 于 复杂 ， 会 分 散 我 们 讨论 形式 语义 的 注意 
力 。 尽 管 破 解 一 个 小 编程 语言 很 有 趣 ， 但 是 感谢 解析 工具 和 解析 库 的 存在 ， 在 他 人 工作 的 
基础 上 构造 一 个 语法 解析 器 并 不 是 特别 困难 ， 因 此 下 面 将 对 其 简单 介绍 一 下 。 











Treetop (http://treetop.rubyforge.org/) 是 Ruby 可 用 的 语法 解析 工具 中 最 好 的 一 个 ， 它 是 一 
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种 特定 领域 的 语言 ， 能 让 语法 解析 器 自动 生成 。 一 种 语言 的 Treetop 描述 会 写成 解析 表达 
式 语法 (parsing expression grammar) ， 这 是 一 个 简单 的 类 正则 表达 式 (regular-expression- 
like ) 的 规则 集合 ， 既 易 写 又 易 理 解 。 最 好 的 是 ， 这 些 规则 能 够 使 用 方法 定义 作为 注释 ， 
这 样 的 话 ， 就 可 以 为 语法 解析 过 程 中 生成 的 Ruby 对 象 定义 行为 。Treetop 既 能 定义 语法 结 
构 ， 又 能 定义 基于 这 些 结构 进行 运算 的 Ruby 代码 集合 ， 这 使 Treetop 很 适合 描述 一 种 语言 
的 语法 并 赋予 它 可 执行 的 语义 。 





为 了 让 我 们 体验 一 下 这 是 如 何 工 作 的 ， 下 面 给 出 关于 Simple 的 Treetop 语法 简装 版 ， 它 只 
包含 解析 字符 串 “while (x < 5) { x =x * 3 }” 所 需要 的 规则 : 





grammar Simple 
rule statement 
while / assign 


end 
rule while 
'while (' condition:expression ') { ' body:statement ' } { 
def to ast 
While.new(condition.to ast, body.to ast) 
end 
} 
end 


rule assign 


name:[a-z]+ ' = ' expression { 
def to ast 
Assign.new(name.text value.to_sym, expression.to ast) 
end 
} 
end 


rule expression 
less than 
end 


rule less than 
left:multiply ' < ' right:less than { 
def to ast 
LessThan.new(left.to ast, right.to ast) 
end 
} 
# 
multiply 
end 


rule multiply 
left:term ' * ' right:multiply { 
def to ast 
Multiply.new(left.to ast, right.to ast) 
end 


term 





end 


rule term 
number / variable 
end 


rule number 
[0-9]+ { 
def to ast 
Number.new(text_value.to i) 
end 
} 
end 
rule variable 
[a-z]+ { 
def to ast 
Variable.new(text_value.to_sym) 
end 


} 
end 
end 


这 种 语言 看 起 来 有 点 像 Ruby， 但 这 种 相似 性 只 是 表面 的 ; 语法 是 用 特别 的 Treetop 语言 写 
出 来 的 。 关 键 字 rule 为 分 析 一 种 特定 种 类 的 语法 引入 一 个 新 的 规则 ， 并 且 每 个 规则 里 的 表 
达 式 描述 了 它 将 要 识别 的 字符 串 结 构 。 规 则 可 以 递归 地 调用 其 他 规则 一 一 例如 while 规则 
调用 表达 式 (expression) 规则 和 语句 (statement) 规则 一 一 而 且 分 析 从 第 一 条 规则 开始 ， 
这 是 这 种 语法 中 的 语句 。 














这 些 表达 式 语法 规则 彼此 调用 的 顺序 反应 了 Simple 运算 符 的 优先 级 。 表 达 式 语法 调用 
less_than， 然 后 less_than 立即 调用 multiply， 在 less_than 对 优先 级 更 低 的 运算 符 < 进 
行 匹配 之 前 ，multiply 能 在 字符 串 中 匹配 到 * 运算 符 。 这 确保 表达 式 '1 * 2 < 3' 被 解析 
成 <(1* 2) < 3» 而 不 是 «1 * (2 < 3)»。 























为 了 让 事情 简单 ， 这 个 语法 没有 试图 限制 可 以 在 一 种 表达 式 中 出 现 的 另 一 种 
一 人 aas) 表达 式 种 类 ， 这 意味 着 这 个 表达 式 将 会 接受 一 些 明显 错误 的 程序 。 






































例如 ， 对 于 二 元 表达 式 less_than 和 multiply， 我 们 设 定 了 两 个 规则 一 一 但 
是 分 别 设立 两 个 规则 的 唯一 原因 是 为 了 强调 运算 符 的 优先 级 ， 这 样 每 一 个 规 
则 只 要 求 一 个 更 高 优先 级 的 规则 匹配 其 左 侧 运 算 对 象 ， 然 后 同样 或 者 更 高 优 
先 级 的 规则 匹配 其 右 侧 运算 对 象 。 这 将 使 像 '1 < 2 < 3 这 样 的 字符 串 能 成 
功 通 过 解析 ， 即 便 Simple 的 语义 无 法 赋予 这 个 表达 式 结果 一 个 含义 。 























这 些 问 题 中 有 一 些 可 以 通过 对 语法 稍 作 调整 得 以 解决 ， 但 是 总 会 有 其 他 一 些 
不 正确 的 情况 语法 解析 器 不 能 识别 。 这 一 问题 我 们 将 分 成 两 个 关注 点 ， 首 先 
保持 语法 解析 器 尽 可 能 的 自由 ， 其 次 将 在 第 9 章 使 用 一 个 不 同 的 技术 来 检测 
无 效 的 程序 。 











语法 中 大 多 数 的 规则 都 使 用 外 边 带 上 括号 的 Ruby 代码 标注 。 在 每 一 个 括号 里 ， 代 码 都 定 
义 一 个 叫 批 o_ast 的 方法 ， 在 解析 一 个 Simple 程序 的 时 候 ， 它 能 用 在 由 Treetop 构建 的 对 
应 语法 对 象 上 。 


如 果 把 这 个 语法 保存 到 叫 作 simple.treetop 的 文件 里 ， 我 们 可 以 使 用 Treetop 加 载 它 来 生 
成 一 个 SimpleParser 类 。 这 个 解析 器 可 以 把 一 个 由 Simple 源 代 码 组 成 的 字符 串 转 换 成 由 
Treetop 的 SyntaxNode 对 象 构建 出 来 的 一 个 表示 : 





























require “treetop” 

true 

Treetop.1load('simple') 

SimpleParser 

parse tree = SimpleParser.new.parse('while (x < 5)){x=x*3}') 
SyntaxNode+While1i+Whileo offset=0, "...5) { x = x * 3 }" (to ast,condition,body): 


SyntaxNode offset=0, "while (" 
SyntaxNode+LessThan1+LessThan0 offset=7, "x < 5" (to ast,left,right): 
SyntaxNode+Variable0 offset=7, "x" (to ast): 
SyntaxNode offset=7, "x" 
SyntaxNode offset=8, "< " 
SyntaxNode+Number0 offset=11, "5" (to ast): 
SyntaxNode offset=11, "5" 
SyntaxNode offset=12, ") {" 
SyntaxNode+Assign1+Assign0 offset=16, "x = x * 3" (to ast,name,expression): 
SyntaxNode offset=16, "x": 
SyntaxNode offset=16, "x" 
SyntaxNode offset=17, "=" 
SyntaxNode+Multiply1+Multiply0 offset=20, "x * 3" (to ast,left,right): 
SyntaxNode+Variable0 offset=20, "x" (to ast): 
SyntaxNode offset=20,"x" 
SyntaxNode offset=21, " * " 
SyntaxNode+NumbeTr0 offset=24, "3" (to ast): 
SyntaxNode offset=24, "3" 
SyntaxNode offset=25, " }" 


这 个 SyntaxNode 结构 是 一 个 具体 语法 树 : 它 专门 为 了 Treetop 的 处 理 而 设计 ， 并 且 含 有 
关于 这 个 具体 语法 树 的 节点 是 如 何 与 生成 它们 的 原始 代码 关联 起 来 的 大 量 信息 。 下 面 是 
Treetop 文档 [ae se OSI EN 不 得 不 说 的 一 些 话 : 


we 已 向 下 遍历 语法 树 ， 并 且 不 要 把 这 棵 树 的 结构 作为 你 自己 常用 的 数 


结构 。 它 包含 的 节点 比 你 应 用 程序 所 需要 的 要 多 得 多 ， 基 至 为 输入 的 每 个 字符 


， emo 

但 是 ， 你 可 以 为 根 规则 增加 方法 ， 根 规则 以 一 种 合理 的 格式 返回 你 需要 的 信息 。 
每 个 规则 可 以 调用 它 的 子规 则 ， 并 且 从 外 面 党 试 遍历 树 时 ， 利 用 这 些 遍历 语 法 树 
的 方法 是 一 个 非常 好 的 选择 。 


这 就 是 我 们 已 经 做 到 的 。 我 们 没有 直接 操纵 这 棵 乱糟糟 的 树 ， 而 是 使 用 语法 中 的 标记 在 每 
个 节点 上 定义 一 个 而 o_ast 方法 。 如 果 在 根 节点 上 调用 这 个 方法 ， 它 会 根据 Simple 的 语法 








对 象 构建 一 棵 抽象 语法 树 。 


>> statement = parse tree.to ast 
=> «while (x < 5) {x=x*3}» 


这 样 我 们 已 经 自动 地 把 源 代码 转换 成 了 一 棵 抽象 语法 树 ， 并 且 现 在 可 以 使 用 这 棵 树 以 通常 
的 方式 查看 程序 的 含义 了 : 


>> statement.evaluate({ x: Number.new(1) }) 

=> {:x=>«9»} 

>> statement.to ruby 

=> "-> e { while (->e { (-> e { e[:x] }).call(e) < (-> e {5 }).call(e) }).call(e); 
e=(->e {e.merge({ :x => (->e {(-> e { e[:x] }).call(e) * (-> e { 3 }).call(e) 
}).call(e) }) }).call(e); end; e }" 





这 个 解析 器 和 Treetop 通常 还 有 一 个 缺点 ， 就 是 生成 一 个 右 结合 的 具体 语法 树 。 
一 CG 这 意味 着 字符 趾 ,1 * 2 * 3 * 4 被 解 折 时 会 被 当成 : '1 * (2 * (3 * 用 ) 
>> expression = SimpleParser.new.parse('1 * 2 * 3 * 4', root: :expression).to ast 
=% 
>> expression. left 
= 1» 
>> expression.right 
=> «2 * 3 * 4» 
但 是 乘法 通常 是 左 结合 的 : 写 1* 2 * 3 * 4' 的 时 候 ， 我 们 实际 的 意思 古 
'((1 * 2) * 3) * 4'， 这 里 数字 是 从 表达 式 的 左边 (而 非 右 边 ) 开始 分 组 结 
合 的 。 对 乘法 来 说 这 没什么 关系 一 一 求 值 的 时 候 两 种 方式 会 产生 同样 的 结 
果 一 一 但 对 像 减 法 和 除法 这 样 的 运算 就 有 问题 了 ， 因 为 对 «((1 - 2) - 3) - 4 
求 值 的 结果 与 对 «1 - (2 - (3 - 4))» 求 值 的 结果 并 不 相同 。 
为 了 修正 这 个 缺点 ， 我 们 不 得 不 让 这 些 规则 和 批 o_ast 实现 得 更 加 复杂 一 
些 。 参 考 6.2.3 节 ， 那 里 有 构建 左 结合 AST 的 Treetop 语法 。 
能 够 像 这 样 解析 Simple 程序 很 方便 ， 但 是 因为 困难 的 工作 都 由 Treetop 做 了 ， 所 以 我 们 对 
一 个 语法 解析 器 实际 如 何 工作 并 没有 了 解 多 少 。 在 4.3 市 ， 你 将 会 看 到 如 何 直 接地 实现 一 
个 解析 器 。 
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最 简单 的 计算 机 





百 短 的 儿 年 里 ， 我 们 已 经 身 处 计算 机 的 海洋 。 本 来 它们 都 安全 地 隐藏 在 军事 研究 中 心 和 大 
学 实验 室 中 ， 但 现在 已 经 随处 可 见 : 我 们 的 办 公 旧 上， 我 们 的 口袋 里 ， 汽 车 的 发 动机 备 
下 ， 其 至 植 和 人 了 我 们 的 身体 。 作 为 程序 员 ， 我 们 每 天 都 在 使 用 精密 的 计算 机 ， 但 对 它们 的 
工作 方式 了 解 多 少 呢 ? 


现代 计算 机 的 强大 能 力 伴随 着 过 多 的 复杂 性 。 我 们 很 难 理解 一 台 计 算 机 多 个 子 系统 的 全 部 
细 方 ， 更 别 说 理解 那些 子 系统 如 何 互 相 协 作 从 而 构成 整个 系统 了 。 这 些 复杂 性 使 得 对 真实 
计算 机 的 能 力 与 行为 进行 直接 推导 显得 不 切实 际 ， 此 时 计算 机 的 简化 模型 就 显得 很 有 用 
了 ， 虽 然 模型 只 是 提取 出 真实 计算 机 中 令 人 感 兴趣 的 特性 ， 但 它 确 实 能 够 帮助 人 们 建立 完 
整 的 认识 。 























本 章 ， 我 们 将 抽 丝 剥 莫 ， 揭 开 计 算 机 的 本 质 ， 看 看 它 到 底 能 干 些 什么 ， 并 考察 这 样 一 台 简 
单 计算 机 所 能 完成 工作 的 极限 。 


3.1 确定 性 有 限 自动 机 


现实 中 ， 计 算 机 通常 都 有 大 量 的 易 失 存储 器 (RAM) 和 非 多 核 易 失 存 储 器 (硬盘 或 者 
SSD)， 有 许多 输入 /输出 设备 ， 还 有 能 同时 执行 多 个 指令 的 处 理 器 。 有 限 状 态 机 (finite 
state machine)， 也 叫 有 限 自动 机 (finite automaton)， 是 一 台 计 算 机 的 极 简 模型 ， 为 了 容易 
理解 、 推 导 并 且 容 易 用 硬件 或 软件 实现 ， 它 放弃 了 上 面 所 有 的 这 些 特性 。 
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3.1.1 状态、 规则 和 输入 

有 限 自动 机 没有 持久 化 的 存储 并 且 几 和 平 没 有 RAM。 它 只 是 一 台 小 机 器 ， 拥 有 一 些 可 能 的 
状态 ， 并 能 够 跟踪 到 自己 当前 县 体 处 于 其 中 的 哪个 状态 一 一 试 着 把 它 看 成 一 台 RAM 只 够 
存储 一 个 值 的 计算 机 。 同 样 ， 有 限 自 动机 没有 键盘 、 鼠 标 和 接收 输入 的 网 络 接口 ， 只 有 一 
个 外 部 的 字符 输入 流 可 以 一 次 读 取 一 个 字符 。 

















每 台 有 限 自动 机 没有 通用 的 CPU 执行 任意 程序 ， 而 是 硬 编码 了 一 些 规 则 集合 ， 以 决定 在 
相应 的 输入 下 如 何 从 一 个 状态 切换 到 另 一 个 状态 。 自 动机 先 从 一 个 特定 的 状态 开始 ， 然 后 
从 输入 流 中 读 入 字符 一 一 按照 规则 它 每 次 读 取 一 个 字符 。 


血 是 一 台 有 限 自 动机 的 结构 图 : 


-@,.@ 


两 个 圆 代表 自动 机 的 两 个 状态 一 一 1 和 2。 凭空 出 现 的 箭头 表明 这 人 台 自 动机 从 状态 1 开始 ， 
1 是 它 的 起 始 状态 。 两 个 状态 之 间 的 箭头 代表 机 器 的 规则 : 

。 处 于 状态 1 并 且 读 入 字符 a 时 ， 切 换 到 状态 2 

。 处 于 状态 2 并且 读 入 字符 a 时 ， 切 换 到 状态 1。 











下 


























这 让 我 们 有 足够 的 信息 研究 机 器 如 何 处 理 一 个 输入 流 。 














这 台 机 器 从 状态 1 开始 。 

这 台 机 器 只 有 从 输入 流 读 入 字符 a 的 规则 ， 因 此 这 是 唯一 能 发 生 的 事情 。 读 取 到 a 的 时 
候 ， 它 会 从 状态 1 切换 到 状态 2。 

当 这 人 台 机 器 又 读 取 到 了 一 个 a 时 ， 它 会 切换 回 状 态 1 。 





一 旦 回 到 状态 1， 它 又 将 开始 重复 自身 ， 这 就 是 这 人 台 机 器 的 行为 范围 。 我 们 可 以 认为 当前 
状态 的 信息 存在 于 机 器 内 部 一 一 它 像 一 个 “ 黑 盒 ”一 样 运转 ， 并 不 会 展现 其 内 部 工作 状 
况 一 一 这 人 台 无 聊 的 机 器 毫 无 用 处 ， 没 有 任何 能 观察 到 的 输出 。 即 使 这 人 台 机 器 一 直 在 状态 1 
和 状态 2 之 间 切 换 ， 机 器 之 外 也 没有 一 个 人 能 看 出 来 有 什么 事情 在 发 生 。 因 此 在 这 种 情况 
下 ， 我 们 可 能 还 要 增加 一 个 状态 ， 这 样 就 不 用 再 为 任何 内 部 结构 操心 了 。 


3.1.2 输出 

为 了 解决 这 个 问题 ， 有 限 自 动机 还 有 一 个 产生 输出 的 基本 方法 。 与 现实 中 计算 机 复杂 的 和 输 
出 能 力 相 比 这 不 值 一 提 ， 我 们 只 是 把 一 些 状 态 标记 成 特别 状态 ， 并 且 认 为 机 器 的 单 比特 输 
出 提供 了 当前 是 否 处 于 特别 状态 的 信息 。 对 于 这 台 机 器 ， 我 们 将 状态 2 作为 特别 状态 ， 并 
在 图 中 用 双重 的 圆 形 表示 它 。 
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-@. 


这 些 特 定 状态 通常 称 为 接受 状态 表明 这 台 机 器 对 某 个 输入 序列 是 接受 还 是 拒绝 。 如 果 这 
台 自 动机 从 状态 1 开始 并 读 入 一 个 a， 它 将 会 停留 在 状态 2， 这 是 一 个 接受 状态 ， 因 此 我 
们 可 以 说 这 台 机 器 接受 字符 串 'a'。 另 外 ， 如 果 它 先 读 到 一 个 a， 然 后 又 读 取 了 另 一 个 a， 
er er nod mn ei nh eh fees an 
看 到 ， 这 SO 、"aaa' 、'aaaaa' 都 能 被 接受 ， 
但 是 'aa'、'aaaa' 和 '' ( 空 字符 串 ) 会 被 拒绝 。 


























现在 有 了 稍 有 用 一 些 的 东西 : 一 台 机 器 ， 人 个 字符 序 列 ， 并 且 提 供 一 个 “是 
/ 否 ”的 输出 ， 以 表明 这 个 序列 是 否 已 经 被 接受 。 公 道 地 说 ， 这 个 DFA (Deterministic 
Finite Automata) 正在 执行 计算 ， 因 为 我 们 可 以 向 它 提 问 “这 个 字符 串 的 长 度 是 奇数 
吗 ? ”一 “然后 得 到 一 个 有 意义 的 答案 。 它 足以 称 为 简单 计算 机 了 ， 并 且 我 们 可 以 将 它 的 
特性 与 一 台 现 实 中 的 计算 机 进行 对 比 : 














真实 计算 机 有 限 自动 机 
持久 存储 硬盘 或 者 SSD 无 
临时 存储 RAM 当前 状态 
输入 键盘 、 鼠 标 、 网 络 等 字符 流 
输出 显示 设备 、 话 简 、 网 络 等 当前 状态 是 否 为 一 个 接受 状态 (是 / 否 ) 
处 理 器 能 执行 任何 程序 的 CPU 核心 根据 输入 改变 状态 的 硬 编码 规则 











当然 ， 这 人 台 自 动机 不 做 任何 精细 或 者 有 用 的 工作 ， 但 是 我 们 可 以 构造 更 复杂 的 自动 机 ， 让 
它 拥 有 更 多 的 状态 并 且 能 够 读 取 多 个 字符 。 下 面 的 自动 机 有 三 个 状态 ， 并 且 能 够 读 取 输入 
a 和 0b: 











b a a,b 
一 全 “全国 
机 器 接受 'ab'、'baba' 以 及 'aaaab' 这 样 的 字符 串 ， 并 且 拒 绝 'a'、'baa' 和 'bbbba' 


这 台 
这 样 的 字符 串 。 实 验 表 明 ， 它 只 接受 包含 序列 'ab' 的 字符 串 ， 因 此 仍然 没有 多 大 用 ,但 至 
展现 了 一 定 程度 的 精妙 之 处 。 本 章 后 面 我 们 将 看 到 更 实际 的 应 用 。 








> 





3.1.3 ”确定 性 
很 明显 ， 这 种 自动 机 具有 确定 性 : 不 管 它 当前 处 于 什么 状态 ， 并 且 不 管 读 入 什么 字符 ， 最 
终 所 处 的 状态 总 是 完全 确定 的 。 只 要 满足 下 面 两 个 约束 ， 就 能 保证 这 种 确定 性 。 
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。 没有 冲突 不 存在 这 样 的 状态 : 它 的 下 一 次 转换 状态 因为 有 彼此 冲突 的 规则 而 有 二 义 性 。 
(这 意味 着 一 个 状态 对 于 同样 的 输入， 不 能 有 多 个 规则 。) 














没有 遗漏 ”不 存在 这 样 的 状态 : 它 的 下 一 次 转换 状态 因为 缺失 规则 而 未 知 。( 这 意味 着 








每 个 状态 都 必须 针对 每 个 可 能 的 输入 字符 有 至 少 一 个 规则 ,) 


综 上 所 述 ， 这 些 约束 意味 着 对 每 一 个 状态 和 输入 的 组 合 ， 这 台 机 器 一 定 要 恰好 有 一 个 规 


则 。 


遵守 这 些 确定 性 约束 的 机 器 有 一 个 技术 名 称 ， 就 是 确定 性 有 限 自动 机 (Deterministic 


Finite Automaton, DFA ) 。 


3.1.4 ”模拟 
确定 性 有 限 自动 机 是 计算 的 抽象 模型 。 我 们 已 经 画 了 一 些 示 例 机 器 的 简 图 ， 而 且 思 考 了 它们 
的 行为 ， 但 是 这 些 机 器 实际 上 并 不 存在 ， 因 此 我 们 不 能 真正 给 它们 一 些 输 入 然后 看 它们 的 表 


现 。 








幸运 的 是 ，DFA 非常 简单 ， 我 们 很 容易 用 Ruby 对 其 进行 模拟 ， 然 后 直接 与 它 交 互 。 





让 我 们 通过 实现 一 个 规则 集合 对 其 进行 模拟 ， 并 把 这 个 规则 集合 称 为 规则 手册 (rulepook) : 





class FARule < Struct.new(:state, :character, :next state) 
def applies to?(state, character) 
self.state == state && self.character == character 
end 


def follow 
next_state 
end 


def inspect 
"#<FARule #{state.inspect} --#{character}--> #{next state.inspect}>" 
end 
end 


class DFARulebook < Struct.new(:rules) 
def next state(state, character) 
rule for(state, character).follow 
end 


def rule for(state, character) 
rules.detect { |rule| rule.applies to?(state, character) } 
end 
end 


这 段 代 码 为 规则 建立 了 一 个 简单 的 API: 每 个 规则 都 有 一 个 #applies_to? 方法 (这 个 方法 会 
返回 true 或 者 false， 指 示 这 个 规则 是 否 可 以 在 某 个 特定 情况 下 应 用 )， 还 有 一 个 村 ollow 方 
法 














(在 决定 采用 某 条 规则 后 返回 关于 机 器 应 该 如 何 改变 的 信息 )。' DFARulebook#next_state 





注 1: 这 











个 设计 足够 通用 ， 可 以 适应 不 同 种 类 的 机 器 和 规则 ， 因 此 在 本 书 稍 后 情况 更 复杂 的 情况 下 我 们 还 可 
以 重用 它 。 
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使 用 这 些 方法 定位 到 正确 的 规则 ， 并 找到 DFA 接 下 来 的 状态 
oo 通过 使 用 Enumerable#detect，DFARulebook#next_state 的 实现 假定 总 是 恰好 有 
wg。 一 个 规则 应 用 到 给 定 的 状态 和 字符 上 。 如 果 可 用 的 规则 超过 一 个 ， 那么 只 有 
全 ， 第 一 个 能 起 作用 ， 其 他 规则 都 会 被 忽略 ， 如 果 没 有 可 以 应 用 的 规则 ，#detect 
调用 会 返回 ni1， 并 且 在 试图 调用 nil.follow 的 时 候 模 拟 进 程 会 崩溃 。 















































这 就 是 为 什么 这 个 类 叫 DFARulebook 而 不 是 FARulebook 了 : 它 只 是 在 确定 性 
约束 满足 的 情况 下 才 正 确 工作 。 


一 个 规则 手册 能 够 把 许多 规则 封装 到 一 个 对 象 里 ， 然 后 询问 它 接 下 来 是 什么 状态 : 


>> rulebook = DFARulebook.new([ 
FARule.new(1, 'a', 2), FARule.new(1, 'b', 1), 
FARule.new(2, 'a', 2), FARule.new(2, 'b', 3), 
FARule.new(3, 'a', 3), FARule.new(3, 'b', 3) 


]) 
=> #<struct DFARulebook ...> 
>> rulebook.next_state(1, 'a') 
=> 2 
>> rulebook.next state(1, 'b') 
=> 1 
>> rulebook.next state(2, 'b') 
sy》 3 








于 能 把 这 些 状态 区 分 开 来 : 我 们 对 DFARulebook#next_state 的 实现 需要 能 够 


”比较 两 个 状态 ， 以 判定 它们 是 否 相 同 ， 但 并 不 关心 那些 对 象 是 数字 、 符 号 、 
字符 串 、 散 列 ， 还 是 0bject 类 的 匿名 实例 。 


央 <， 
攻 此 处 我 们 面临 一 个 选择 ， 即 如 何 把 自动 机 的 状态 表示 成 Ruby 的 值 。 重 点 在 
' 3 








在 这 种 情况 下 ， 最 清晰 的 方式 是 使 用 普通 的 Ruby 数字 一 一 它们 能 很 好 地 
配 图 中 带 编号 的 状态 ， 因 此 我 们 就 是 这 么 做 的 。 





加 























有 了 一 个 规则 手册 之 后 ， 我 们 可 以 用 它 来 构建 一 个 DFA 对 象 ， 以 跟踪 它 的 当前 状态 ,并且 
可 以 报告 它 当前 是 否 处 于 接受 状态 : 





class DFA < Struct.new(:current state, :accept states, :rulebook) 
def accepting? 
accept states.include?(current state) 
end 
end 


>> DFA.new(1, [1, 3], rulebook).accepting? 
=> true 

>> DFA.new(1, [3], rulebook).accepting? 

=> false 
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现在 可 以 写 一 个 方法 从 输入 中 读 取 一 个 字符 ， 然 后 





class DFA 
def read character(character) 














古 查 阅 规则 手册 ， 星 


了 相应 地 改变 状态 








self.current state = rulebook.next state(current state, character) 


end 
end 


为 DFA 输入 字符 串 ， 然 后 观察 它 输出 的 改变 : 


>> dfa = DFA.new(1, [3], rulebook); dfa.accepting? 


=> false 
>> dfa.read_character('b'); dfa.accepting? 
=> false 


>> 3.times do dfa.read character('a') end; dfa.accepting? 


=> false 
>> dfa.read character('b'); dfa.accepting? 
=> true 





一 次 只 癌 DFA 输入 一 符 有 些 不 方便 ， 所 以 添加 一 个 方便 的 方法 来 读 取 输入 的 整 
符 囊 : 
class DFA 


现在 可 以 向 DFA 输入 整个 字符 串 了 ， 而 不 再 只 是 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 

















分 别传 入 单个 字符 : 


>> dfa = DFA.new(1, [3], rulebook); dfa.accepting? 


=> false 
>> dfa.read string('baaab'); dfa.accepting? 
=> true 


一 旦 DFA 获得 了 一 些 输入 ， 它 就 可 能 不 再 处 于 起 始 状态 了， 因此 我 们 不 能 再 次 使 用 它 检 
查 输入 的 一 个 新 的 完整 序列 。 这 意味 着 要 从 头 创 建 它 一 一 像 以 前 那样 使 用 同样 的 起 始 状 
接受 状态 和 规则 手册 一 一 每 当 想 要 检查 它 是 否 接 受 一 个 新 的 字符 串 时 。 我 们 可 以 在 
一 个 对 象 里 封装 它 的 构造 参数 来 避免 手工 执行 这 一 操作 ， 这 个 对 象 表示 设计 出 来 的 特定 


态 、 


DFA, >» ob 要 检查 是 否 可 以 接受 一 个 


的 





class DFADesign < Struct.new(:start state, 
def to dfa 


:accept_ states, 








DFA.new(start state, accept states, rulebook) 


end 


def accepts?(string) 





新 的 字符 串 ， 就 靠 此 对 象 自动 地 构建 那个 DFA 





:rulebook) 





to dfa.tap { |dfa| dfa.read string(string) }.accepting? 





end 

end 

过 入 

4 ttap 方法 对 一 个 代码 块 求 值 ， 然 后 返回 调用 它 的 对 象 。 
~ 


DFADesign#accepts? 使 用 DFADesign#to_dfa 方法 创建 一 个 DFA 的 新 实例 ， 然 后 调用 #read_ 
string? 把 它 放 到 一 个 接受 态 或 者 拒绝 态 里 : 





>> dfa design = DFADesign.new(1, [3], rulebook) 
=> #<struct DFADesign ...> 

>> dfa design.accepts?('a') 

=> false 

>> dfa design.accepts?('baa') 

=> false 

>> dfa_design.accepts?('baba') 

=> true 


3.2” 非 确定 性 有 限 自 动机 


DFA 理解 和 实现 起 来 都 很 简单 ， 但 那 是 因为 它 与 我 们 熟悉 的 机 器 非常 相似 。 在 去 除 一 
台 真 实 计 算 机 的 所 有 复杂 性 之 后 ， 我 们 有 机 会 使 用 不 太 常 见 的 思想 进行 实验 了 ， 这 将 让 
我 们 远离 熟悉 的 机 器 ， 并 可 以 不 必 处 理 把 这 些 思想 落实 到 真实 系统 中 时 可 能 遇 到 的 各 种 
困难 。 


一 种 探索 方式 是 去 掉 我 们 现 有 的 假设 和 约束 。 首 先 ， 确 定性 约束 似乎 是 个 限制 ， 可 能 我 们 
并 不 关心 每 个 状态 上 每 个 可 能 的 输入 ， 那 么 为 什么 不 能 忽略 不 关心 的 字符 处 理 规则 ， 而 假 
设 异 常 发生 时 这 台 机 器 能 进入 到 一 个 通用 的 失败 状态 呢 ?” 更 异乎 寻常 的 是 ， 如 果 允 许 这 台 
机 器 拥有 互相 对 立 的 规则 ， 以 致 有 多 条 可 能 的 执行 路 径 ， 这 将 意味 着 什么 呢 ?” 我 们 之 前 的 
设置 还 假设 ,每 一 个 状态 改变 一 定 对 应 从 输入 流 读 入 一 个 字符 ,但 是 如 果 在 不 进行 读 取 的 
时 候 机 器 也 能 改变 状态 ， 将 会 怎样 呢 ? 

在 这 一 市 ， 我 们 将 探索 这 些 想 法 ， 在 对 有 限 自动 机 的 能 力 稍 做 调整 之 后 ， 看 看 是 否 有 什么 
新 的 可 能 性 。 


3.2.1 非 确 定性 
假设 我 们 想 要 一 台 有 限 自 动机 ， 它 能 接受 由 a 和 b 组 成 的 第 三 个 字符 是 b 的 任意 字符 串 。 此 
时 很 容易 想 出 一 个 合适 的 DFA 设计 : 
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如 果 想 要 一 台 机 器 能 接受 倒数 第 三 个 字符 是 b 的 字符 串 ， 怎 么 办 呢 ? 那 将 如 何 工 作 呢 ? 似 
乎 更 加 困难 : 上面 的 DFA 能 保证 在 读 第 三 个 字符 的 时 候 处 于 状态 3， 但 是 一 台 机 器 无 法 
预先 知道 什么 时 候 能 读 到 倒数 第 三 个 字符 ， 因 为 在 结束 读 取 之 前 它 不 知道 这 个 字符 串 有 多 
长 。 其 至 这 样 的 一 台 DFA 是 否 可 能 存在 都 不 一 定 能 立刻 清楚 。 


但 是 ， 如 果 我 们 放松 确定 性 的 限制 ,并且 允 许 规则 手册 对 于 一 个 状态 和 输入 包含 多 条 规则 
(或 者 根本 没有 规则 ) ， 那 么 就 可 以 设计 一 台 能 完成 任务 的 机 器 : 





























a,b 


， 
-OO*© 人 


这 是 一 台 非 确定 性 有 限 自动 机 (NFA)， 对 每 一 个 输入 序列 不 再 只 有 一 条 执行 路 径 。 处 于 
状态 1 并 且 读 入 b 的 时 候 ， 它 可 能 会 按照 一 条 规则 仍 保持 在 状态 1， 但 也 可 能 会 按照 另 
一 条 规则 进入 状态 2。 反 过 来 ， 一 且 进 入 状态 4， 它 找 不 到 任何 规则 可 以 遵守 ， 因 此 没 法 
再 继续 读 取 输入 。 一 台 DFA 的 下 一 状态 总 是 完全 由 它 的 当前 状态 和 输入 决定 ， 但 是 一 台 
NFA 在 向 下 一 个 状态 转移 时 会 有 多 种 可 能 性 ， 而 且 有 了 时候 根本 无 法 转移 。 


如 果 一 台 DFA 读 取 一 个 字符 串 然后 完全 按照 规则 执行 ， 并且 最 终 终 止 于 一 个 接受 状态 ， 
那 它 就 能 接受 这 个 字符 串 。 那 么 对 于 一 台 NFA 来 说 ， 什 么 才能 表示 一 台 NFA 接受 或 者 拒 
绝 一 个 字符 串 呢 ? 很 自然 的 回答 是 ， 如 果 存 在 某 条 路 径 能 让 NFA 按照 它 的 某 些 规则 执行 
并 终止 于 一 个 接受 状态 ， 那 它 就 能 接受 这 个 字符 串 ; 这 就 是 说 ， 即 使 不 是 必然 的 ， 只 要 终 
止 于 一 个 接受 状态 是 可 能 的 就 可 以 。 





























例如 ， 这 台 NFA 接受 字符 串 'baa' ， 因 为 从 状态 1 开始 ， 有 一 条 路 径 可 以 让 这 人 台 机 器 读 取 
一 个 b 转移 到 状态 2， 再 读 取 一 个 a 转移 到 状态 3， 最 后 读 一 个 a 终止 于 状态 4， 这 是 一 个 
接受 态 。 它 还 接受 字符 串 'bbbbb' ， 因 为 NFA 可 以 在 读 取 前 两 个 b 的 时 候 ， 按 照 另 一 条 规 
则 执行 并 停留 在 状态 1， 然 后 在 读 第 三 个 b 的 时 候 使 用 规则 转移 到 状态 2， 再 读 取 字 符 串 
的 其 他 部 分 ， 并 向 以 前 那样 终止 于 状态 4。 
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男 一 方面 ， 没 有 读 取 'abb' 并 终止 于 状态 4 的 方法 (取决 于 遵照 的 不 同 规则 ， 它 最 终 只 能 
终止 于 状态 1、2 或 者 3)， 因 此 这 台 NFA 不 接受 'abb'。'bbabb' 也 不 行 ， 它 最 多 只 能 到 








达 状 态 3: 如 果 读 入 第 一 个 b 的 时 候 直接 转移 到 状态 2， 它 将 很 快 终止 于 状态 4， 这 样 留 下 
两 个 字符 没有 处 理 但 是 已 经 没有 规则 可 用 了 。 


能 被 一 台 特 定 机 器 接受 的 字符 串 集合 称 为 一 种 语言 : 我 们 说 这 人 台 机 器 识别 了 
心 。 这 种 语言 。 不 是 所 有 的 语言 都 有 一 台 DFA 或 者 NFA 能 识别 它们 ( 详 见 第 4 
全 ， 章 )， 但 那些 能 被 有 限 自动 机 识别 的 语言 称 为 正则 语言 (regular language) 。 








放松 确定 性 约束 已 经 造就 了 一 台 虚 拟 机 器 ， 这 台 虚 拟 机 器 与 我 们 现实 中 熟悉 的 确定 性 机 器 
差别 很 大 。 一 台 NFA 按照 可 能 性 而 不 是 确定 性 工作 : 我 们 根据 可 能 发 生 的 而 不 是 将 要 发 
生 的 来 讨论 它 的 行为 。 这 似乎 很 强大 ， 但 是 这 样 的 机 器 在 现实 世界 中 如 何 工作 呢 ? 初 看 上 
去 ， 现 实 中 一 台 NFA 的 实现 需要 某 种 预见 性 ， 要 在 读 取 输入 的 时 候 从 几 种 可 能 性 中 做 出 
选择 : 为 了 保留 接受 一 个 字符 串 的 可 能 ， 示 例 NFA 一 定 要 在 读 到 倒数 第 三 个 字符 之 前 保 
持 在 状态 1， 但 它 没 法 知道 还 将 收 到 多 少 个 字符 。 我 们 怎么 用 乏味 又 确定 的 Ruby 模拟 这 
样 一 台 激 动人 心 的 机 器 呢 ? 

















在 确定 性 计算 机 上 模拟 一 台 NFA， 关 键 是 找到 一 种 方法 探索 出 这 台 机 器 所 有 可 能 的 执行 。 
这 种 暴力 方法 把 所 有 的 可 能 全 都 摆 出 来 ， 以 此 避免 了 只 模拟 一 种 可 能 执行 时 所 需要 的 “ 幽 
灵 般 ”的 预见 性 。 一 台 NFA 读 到 一 个 字符 的 时 候 ， 它 下 一 步 转移 到 什么 状态 只 会 有 有 限 
数目 的 可 能 性 ， 因 此 我 们 模拟 非 确 定性 时 可 以 尝试 遍历 所 有 可 能 ， 然 后 看 它们 中 哪个 最 终 
到 达 一 个 接受 状态 。 


尝试 遍历 所 有 可 能 时 可 以 采用 递归 的 方式 : 每 当 所 模拟 的 NFA 读 取 一 个 字符 并 且 有 多 个 
可 用 的 规则 时 ， 遵 照 其 中 的 一 条 规则 ， 然 后 尝试 读 取 输 入 的 后 续 部 分 ， 如 果 这 没有 让 机 器 
到 达 一 个 可 接受 状态 ， 就 回 退 到 早期 状态 ， 把 输入 也 倒 回 早期 的 位 置 ， 然 后 按照 另 一 个 不 
同 的 规则 再 次 尝试 ， 如 此 重复 ， 直 到 某 次 选择 的 规则 让 机 器 到 达 一 个 接受 状态 ， 或 者 所 有 
可 能 的 选择 进行 壳 历 的 结果 都 不 成 功 为 止 。 









































还 有 一 个 策略 是 采用 并 行 的 方式 模拟 所 有 可 能 : 每 当 机 器 有 超过 一 条 规则 可 以 遵守 时 就 创 
建新 线程 ， 并 把 需要 模拟 的 NFA 复制 过 去 以 便 复制 的 每 一 份 都 能 尝试 一 条 新 规则 ， 然 后 
观察 它 的 结果 。 所 有 这 些 线程 都 能 同时 执行 ， 每 个 都 从 它 自 己 的 输入 字符 串 副 本 中 读 取 。 
如 果 任 何 一 个 线程 让 机 器 读 取 了 整个 字符 串 ， 并 且 停止 于 一 个 接受 状态 ， 那 么 可 以 说 这 个 
字符 串 已 经 被 接受 了 。 

















这 两 个 实现 都 是 可 行 的 ， 但 是 有 些 复杂 和 低 效 。 我 们 模拟 的 DFA 非常 简单 ， 而 且 能 读 取 
单个 字符 并 报告 这 人 台 机 器 是 否 处 于 一 个 接受 状态 ， 因 此 要 是 能 模拟 一 台 有 同样 简单 和 透明 
的 NFA 就 好 了 。 
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幸运 的 是 ， 存 在 一 个 简单 的 方式 模拟 NFA， 而 无 需 回 退 进 程 、 创 建 线程 或 者 预先 知道 所 有 
的 输入 字符 。 事 实 上 ， 就 像 通过 跟踪 一 台 DFA 的 当前 状态 来 模拟 它 一 样 ， 我 们 可 以 通过 
跟踪 一 台 NFA 当前 所 有 可 能 的 状态 模拟 一 台 简 单 的 NFA。 这 样 比 模拟 要 转移 到 不 同方 向 
的 多 份 NFA 更 简单 更 高 效 ， 且 最 终 能 完成 同样 的 事情 。 之 前 ， 如 果 我 们 模拟 很 多 份 独立 
的 机 器 ， 那 么 只 需要 注意 它们 每 一 个 都 处 于 什么 状态 ， 但 处 于 同样 状态 的 机 器 是 完全 无 法 
分 辨 的 "， 因 此 我 们 把 所 有 可 能 都 压缩 到 一 台 机 器 上 并 询问 “到 现在 为 止 它 可 能 处 于 什么 
状态 ”， 这 样 就 不 会 失去 任何 东西 了 。 


举 个 例子 ， 让 我 们 演练 一 下 在 读 取 字 符 串 “bab' 时 示例 NFA 会 发 生 什么 。 





























在 NFA 读 取 任 何 输入 之 前 ， 它 肯定 处 于 起 始 状态 ， 也 就 是 状态 1。 

读 取 第 一 个 字符 b。 在 状态 1， 有 一 个 b 的 规则 可 以 让 NFA 停留 在 状态 1， 并 且 还 有 一 
个 b 的 规则 可 以 把 它 转移 到 状态 2， 这 样 我 们 知道 之 后 它 可 能 处 于 状态 1 或 者 状态 2。 
这 些 都 不 是 接受 状态 ， 这 表明 NFA 不 可 能 通过 读 字 符 串 'b' 到 达 一 个 接受 状态 。 

读 取 第 二 个 字符 a。 如 果 它 处 于 状态 1， 那 么 只 有 一 个 a 的 规则 可 以 用 ， 这 让 它 继续 处 
于 状态 1， 如果 它 处 于 状态 2， 就 只 能 按照 a 的 规则 转移 到 状态 3。 它 一 定 会 终止 于 状 
态 1 或 者 状态 3, 而 这 些 又 都 不 是 接受 状态 ,因此 没有 方法 让 字符 串 'ba' 被 这 台 机 器 接受 。 
读 取 第 三 个 字符 b。 如 果 它 处 于 状态 1， 那 么 就 像 以 前 一 样 ， 继 续 处 于 状态 1 或 者 转移 
到 状态 2， 如 果 它 处 于 状态 3， 那 就 一 定 会 转移 到 状态 4。 

现在 我 们 知道 NFA 在 读 取 整 个 输入 字符 串 之 后 可 能 处 于 状态 1、 状 态 2 或 者 状态 4。 状 
态 4 是 一 个 接受 状态 ， 并 且 我 们 的 模拟 表明 一 定 有 某 种 方式 让 机 器 通过 读 取 那个 字符 串 
到 达 状 态 4， 因 此 这 个 NFA 确实 能 接受 'bab ' 。 






































这 个 模拟 策略 很 容易 转换 成 代码 。 首 先 ， 我们 需要 一 个 适合 存储 NFA 规则 的 规则 手册 。 
当 我 们 询问 DFA 规则 手册 处 于 特定 状态 的 DFA 读 到 一 个 特定 的 字符 之 后 下 一 步 应 该 转 
移 到 何 处 时 ， 它 总 会 返回 一 个 状态 。 但 是 ，NFA 规则 手册 需要 回答 一 个 不 同 的 问题 : 在 
NFA 处 于 几 种 可 能 状态 之 一 时 ， 它 读 取 到 一 个 特定 的 字符 ， 可 能 的 下 一 个 状态 是 什么 呢 ? 
实现 如 下 : 











require 'set' 


class NFARulebook < Struct.new(:rules) 
def next states(states, character) 
states.flat map { |state| follow rules for(state, character) }.to set 
end 


def follow rules for(state, character) 
rules for(state, character).map(&:follow) 
end 











注 2: 一 台 有 限 自动 机 不 记录 自己 的 历史 ,除了 它 的 当前 状态 也 不 做 任何 存储 ， 因 此 处 于 同样 状态 的 两 台 相 





同 的 机 器 不 管 出 于 什么 目的 都 是 可 以 互 换 的 。 
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def rules for(state, character) 


rules.select { |rule| rule.applies to?(state, character) } 
end 


end 














为 了 存储 由 #next_states 返回 的 可 能 状态 ， 我 们 使 用 Ruby 标准 库 中 的 Set 
类 。 我 们 本 来 可 以 使 用 Array 类 ,但 是 Set 类 有 三 个 有 用 的 特性 。 




















(1) 它 自动 去 除 重复 元 素 。Set[1,2,2,3,3,3] 与 Set[1,2,3] 等 价 。 

(2) 它 不 关心 元 素 的 顺序 。Set[3,2,1] 与 Set[1,2,3] 等 价 。 

(3) 它 提供 标准 的 集合 操作 ， 比 如 交集 ( 楷 )、 并 集 ( 打 ) 以 及 子 集 测试 
(#subset? ) 。 

















第 一 个 特性 很 有 用 ， 因 为 “这 台 NFA 处 于 状态 3 或 者 状态 3” 这 句 话 是 讲 不 


通 的 ， 而 且 返 回 一 个 Set 能 确保 永远 不 会 包含 任何 重复 数据 。 其 他 两 个 特性 
的 益处 将 在 稍 后 显现 。 




















我 们 可 以 创建 一 个 非 确定 性 的 规则 手册 并 向 它 提 问 


>> rulebook = NFARulebook.new([ 
FARule.new(1, 'a', 1), FARule.new(1, 'b', 1), FARule.new(1, 'b', 2), 
FARule.new(2, 'a', 3), FARule.new(2, 'b', 3), 
FARule.new(3, 'a', 4), FARule.new(3, 'b', 4) 

]) 

=> #<struct NFARulebook rules=[...]> 

>> rulebook.next states(Set[1], 'b') 

=> #<Set: {1, 2}> 

>> rulebook.next states(Set[1, 2], 'a') 

=> #<Set: {1, 3}> 

>> rulebook.next_ states(Set[1, 3], 'b') 

=> #<Set: {1, 2, 4}> 


下 一 步 就 是 实现 一 个 NFA 类 来 表示 这 台 模 拟 的 机 器 : 


class NFA < Struct.new(:current states, :accept states, :rulebook) 
def accepting? 
(current states & accept states).any? 
end 


end 


方法 NFA#accepting? 通过 检查 是 否 在 current_states 和 accept_states 的 交 
。 集 里 存在 任何 状态 来 完成 自己 的 工作 一 一 也 就 是 说 ， 检 查 当 前 的 可 能 状态 是 


得 2 
” 否 也 是 一 个 接受 状态 。 























这 个 NFA 类 与 我 们 之 前 的 DFA 类 非常 相似 。 不 同 的 是 ， 它 有 一 个 当前 可 能 的 状态 集合 


在 口 


current_states 而 不 是 只 有 一 个 当前 的 确定 状态 current_state， 因 此 如 果 current _ states 
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里 有 一 个 是 接受 状态 ， 就 说 它 处 于 接受 状态 : 


>> NFA.new(Set[1], [4], rulebook).accepting? 

=> false 

>> NFA.new(Set[1, 2, 4], [4], rulebook).accepting? 
=> true 


就 像 DFA 类 一 样 ， 我 们 可 以 实现 一 个 机 ead_character 方法 读 取 输入 中 的 一 个 字符 ， 以 及 
一 个 #read_string 方法 可 以 按 顺序 读 取 几 个 字符 : 


class NFA 
def read character(character) 
self.current states = rulebook.next states(current states, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 





这 些 方 法 实际 上 与 它们 对 应 的 DFA 几乎 完全 相同 ， 只 是 在 拉 ead_character 中 使 用 了 


current_states 和 next_states， 而 不 是 current_state 和 next_state。 





困难 的 工作 结束 了 。 现 在 我 们 可 以 启动 一 个 模拟 的 NFA， 给 它 传 人 字符 ， 并 且 询 问 它 目前 
的 输入 是 否 已 经 被 接受 : 








>> nfa = NFA.new(Set[1], [4], rulebook); nfa.accepting? 
=> false 

>> nfa.read character('b'); nfa.accepting? 

=> false 

>> nfa.read character('a'); nfa.accepting? 

=> false 

>> nfa.read character('b'); nfa.accepting? 

=> true 

>> nfa = NFA.new(Set[1], [4], rulebook) 

=> #<struct NFA current states=#<Set: {1}>, accept states=[4], rulebook=...> 
>> nfa.accepting? 

=> false 

>> nfa.read_string('bbbbb'); nfa.accepting? 

=> true 


就 像 我 们 在 使 用 DFA 类 时 看 到 的 那样 ， 可 以 很 方便 地 使 用 一 个 NFADesign 对 象 根据 需要 自 
动 生产 新 的 NFA 实例 ， 而 不 是 手工 创建 它们 ; 











class NFADesign < Struct.new(:start state, :accept states, :rulebook) 
def accepts?(string) 
to nfa.tap { |nfa| nfa.read string(string) }.accepting? 
end 





def to_nfa 
NFA.new(Set[start state], accept states, rulebook) 
end 
end 





这 让 同一 台 NFA 检查 不 同 的 字符 串 更 容易 : 


>> nfa_design = NFADesign.new(1, [4], rulebook) 

=> #<struct NFADesign start state=1, accept states=[4], rulebook=...> 
>> nfa_design.accepts?('bab') 

=> true 

>> nfa_design.accepts?('bbbbb') 

=> true 

>> nfa_design.accepts?('bbabb') 

=> false 


就 是 这 样 了 。 我 们 已 经 通过 模拟 一 台 非 同 寻常 的 非 确定 性 机 器 的 所 有 可 能 执行 ， 并 构建 了 
它 的 一 个 简单 实现 。 非 确定 性 是 一 个 设计 更 复杂 有 限 自 动机 的 非常 方便 的 工具 ， 因 此 我 们 
很 幸运 能 把 NFA 投入 实际 使 用 而 不 只 是 把 它 作 为 理论 中 的 珍品 。 


3.2.2 自由 移动 (free move) 
我 们 已 经 看 到 ， 对 确定 性 约束 的 放松 带 来 了 设计 机 器 的 新 方式 ， 我 们 不 再 需要 辜 精 竭力 地 
去 实现 它们 了 。 为 了 得 到 更 多 的 设计 自由 ， 我 们 还 可 以 安全 地 放松 哪些 约束 呢 ? 


很 容易 设计 一 台 DFA， 能 接受 长 度 是 2 的 倍数 的 、 由 字符 a 组 成 的 字符 串 〈 "aa 、 "aaaa ……) : 


-©@.® 


但 是 如 何 设计 一 台 机 器 ， 让 它 能 接受 长 度 是 2 或 3 的 倍数 的 字符 串 呢 ? 我 们 知道 非 确定 性 
让 一 台 机 器 可 以 走 多 于 一 条 的 执行 路 径 ， 因 此 或 许可 以 设计 一 台 NFA， 它 有 一 条 “2 的 们 
数 ”的 路 径 和 一 条 “3 的 倍数 ”的 路 径 。 一 个 初步 的 尝试 可 能 看 起 来 像 这 个 样子 : 
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这 台 NFA 的 思想 是 ， 在 状态 1 和 状态 2 之 间 移 动 以 接受 像 'aa' 和 'aaaa' 这 样 的 字符 串 ， 
在 状态 1、 状态 3 和 状态 4 之 间 移 动 以 接受 像 'aaa' 和 'aaaaaaaaa' 这 样 的 字符 串 。 这 工 
作 得 很 好 ， 但 问题 是 这 人 台 机 器 还 会 接受 字符 串 'aaaaa' ， 因 为 它 可 以 从 状态 1 转移 到 状态 2 
然后 读 完 前 两 个 字符 的 时 候 回 到 状态 1， 再 在 状态 3 和 状态 4 之 间 转 移 ， 之 后 在 读 完 接 下 
来 的 三 个 字符 之 后 回 到 状态 1， 终 止 于 一 个 接受 状态 ， 即 使 这 个 字符 串 的 长 度 不 是 2 或 者 
3 的 倍数 。” 
































这 次 ， 一 台 NFA 是 否 能 完成 这 个 工作 还 不 是 很 明显 ， 但 是 我 们 可 以 引入 一 个 叫 作 自由 移 
动 的 机 器 特性 来 解决 此 问题 。 这 些 规则 让 机 器 无 需 读 取 任何 输入 就 能 自发 遵照 执行 ， 并且 
它们 在 这 儿 提 供 帮助 是 因为 能 让 NFA 在 两 组 状态 之 间 做 一 个 初步 选择 : 











自由 移动 表示 成 从 状态 1 到 状态 2 和 状态 4 的 无 标记 虚线 箭头 。 机 器 仍然 接受 字符 串 
“aaaa ， 它 会 先 自发 地 转移 到 状态 2， 然 后 随 着 读 取 输入 在 状态 2 和 状态 3 之 间 转 移 。 类 
似 地 ， 如 果 它 开始 先 自由 移动 到 状态 4 也 能 接受 “aaaaaaaaa 。 但 是 现在 它 没 法 接受 字符 
串 'aaaaa' 了: 不 管 做 任何 可 能 的 执行 ， 它 都 一 定 要 从 到 状态 2 或 者 状态 4 的 转移 开始 ， 
而 且 一 旦 选择 了 其 中 一 条 路 径 转 移 之 后 ， 就 没 法 退回 来 了 。 一 旦 处 于 状态 2， 就 只 能 接受 
一 个 长 度 是 2 的 倍数 的 字符 串 ， 同 样 一 旦 处 于 状态 4， 就 只 能 接受 长 度 是 3 的 倍数 的 字 
符 串 。 











如 何 用 Ruby 模拟 NFA 中 的 自由 移动 呢 ? 当然 ， 是 保持 在 状态 1、 自 发 地 转移 到 状态 2， 
还 是 自发 地 转移 到 状态 4， 这 些 新 选择 并 不 比 已 有 的 非 确 定性 奇怪 多 少 ， 并 且 我 们 的 实现 
能 够 用 类 似 的 方式 处 理 它 。 我 们 已 经 有 了 一 台 模 拟 机 一 次 可 以 有 多 个 可 能 状态 的 思想 ， 
此 只 需要 拓展 那些 可 能 的 状态 ， 把 通过 执行 一 次 或 者 多 次 自由 移动 能 到 达 的 状态 包括 进 























注 3: 实际 上 ， 这 台 NFA 接受 字符 a 组 成 的 任何 字符 串 ， 但 只 有 一 个 字符 的 字符 串 'a' 除外。 
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来 。 在 这 种 情况 下 ,“ 机 器 从 状态 1 开始 ”的 真正 意思 是 : 在 没有 读 取 任 何 输入 之 前 ， 它 
可 能 处 于 状态 1、2 或 4。 


首先 ， 我 们 需要 一 种 用 Ruby 表示 自由 移动 的 方法 。 最 简单 的 方法 就 是 使 用 正常 的 FARule 
实例 ， 只 是 在 一 个 字符 的 位 置 上 填 上 一 个 nil。NFARulebook 的 现 有 实现 将 像 处 理 其 他 任何 
字符 一 样 处 理 ni 计 ， 因 此 我 们 可 以 询问 :“ 从 状态 1， 通过 执行 一 次 自由 移动 (而 不 是 问 : 
“…… 通 过 读 入 一 个 字符 a ?”)， 能 到 达 什 么 状态 ?” 





















































>> rulebook = NFARulebook.new([ 
FARule.new(1, nil, 2), FARule.new(1, nil, 4), 
FARule.new(2, 'a', 3), 
FARule.new(3, 'a' , 2), 
FARule.new(4, 'a', 5), 
FARule.new(5, 'a' , 6), 
FARule.new(6, 'a', 4) 

]) 

=> #<struct NFARulebook rules=[...]> 

>> rulebook.next states(Set[1], nil) 

=> #<Set: {2, 4}> 





下 一 步 需要 一 些 辅 助 代码 帮助 找到 从 一 个 特定 集合 的 状态 开始 ， 通 过 自由 移动 所 铺 pn 
所 有 状态 。 这 些 代码 只 能 反复 自由 移动 ， 因 为 只 要 存在 从 当前 状态 出 发 的 自由 移动 ， 
NFA 就 可 以 多 次 自发 改变 状态 。 可 以 把 它 很 方便 地 放 到 NFARulebook 类 的 一 个 方法 里 : 











class NFARulebook 
def follow free moves(states) 
more_states = next states(states, nil) 


if more states.subset?(states) 
states 
else 
follow free moves(states + more states) 
end 
end 
end 


NFARUlebook#follow free_moves 以 递归 的 方式 查找 越 来 越 多 的 状态 ， 这 些 状 态 能 从 一 个 给 
定 的 集合 通过 自由 移动 到 达 。 再 也 找 不 到 时 ， 即 由 next_states(states,nil) 找到 的 每 一 个 
状态 都 已 经 包含 在 states 里 时 ， 它 就 返回 找到 的 所 有 状态 。 











以 下 代码 正确 地 识别 出 NFA 在 读 取 任 何 输 入 之 前 的 可 能 状态 : 








>> rulebook.follow free moves(Set[1]) 
=> #<Set: {1, 2, 4}> 


现在 通过 覆盖 NFA#current_states 已 有 的 实现 (就 像 履 盖 Struct 提供 的 方法 一 样 )， 我 们 











注 4: 确切 地 说 ， 这 个 过 程 计 算 了 “通过 自由 移动 增加 更 多 状态 ”函数 的 定点 。 
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把 对 自由 移动 的 支持 加 入 到 NFA 当中 。 新 的 实现 将 与 NFARulebook#follow_free_moves 挂 
钧 ， 并 确保 自动 机 当前 可 能 的 状态 总 是 包含 通过 自由 移动 能 到 达 的 任何 状态 : 


class NFA 
def current states 
rulebook.follow free moves(super) 
end 
end 





因为 其 他 所 有 NFA 方法 都 是 通过 调用 #current_states 访问 当前 可 能 状态 的 集合 ， 所 以 这 
种 透明 性 让 我 们 不 必 改 动 NFA 代码 的 其 他 部 分 就 能 支持 自由 移动 。 

这 就 全 部 完成 了 。 现 在 模拟 支持 自由 移动 了 ， 而 且 现 在 能 看 看 哪些 字符 串 能 被 我 们 的 NFA 
接受 了 : 











>> nfa design = NFADesign.new(1, [2, 4], rulebook) 
=> #<struct NFADesign ...> 

>> nfa_design.accepts?('aa') 

=> true 

>> nfa_design.accepts?('aaa') 

=> true 

>> nfa_design.accepts?('aaaaa') 

=> false 

>> nfa_design.accepts?('aaaaaa') 

=> true 


自由 移动 实现 起 来 非常 简单 ， 并 且 在 非 确定 性 的 基础 之 上 给 了 我 们 额外 的 设计 自由 。 





过 La 


本 章 中 有 一 些 非 传统 术语 。 有 限 自 动机 读 取 的 字符 通常 叫 作 符号 (symbol)， 
状态 之 间 移 动 的 规则 叫 作 转 移 (transition)， 组 成 一 台 机 器 的 规则 集合 叫 作 转 
3 移 函 数 (有 时 候 也 叫 NFA 的 转移 关系 ) 而 不 是 规则 手册 。 因 为 表示 空 字符 
串 的 数学 符号 是 希腊 字母 ， 能 自由 移动 的 NFA 称 为 NFA- s ， 自 由 移动 本 
身 通常 称 为 6 转移 。 

















3.3 正则 表达 式 


我 们 已 经 看 到 非 确定 性 和 自由 移动 增强 了 有 限 自 动机 的 表达 能 力 ， 而 且 不 会 干扰 我 们 对 有 限 
自动 机 的 模拟 。 在 这 一 节 ， 我 们 将 会 看 到 这 些 特性 一 个 重要 的 实际 应 用 : 正则 表达 式 匹 配 。 





正则 表达 式 提供 了 书写 模式 的 语言 ， 字 符 串 可 以 按照 这 个 模式 进行 匹配 。 下 面 是 一 些 正 则 
表达 式 的 例子 。 











。 hello， 只 能 匹配 字符 串 "hello ' 。 
。 hello|goodbye， 能 匹配 字符 串 'hello' 和 'goodbye'。 
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。 (hello)* ,匹配 字符 串 'hello'、'hellohello'、'hellohellohello' 等 ,也 与 空 字符 串 匹 配 。 








在 这 一 章 里 ， 我 们 把 正则 表达 式 看 成 是 与 整个 字符 囊 进行 匹配 。 真 实 世界 中 
CE》 的 正则 表达 式 实现 通常 与 部 分 字符 串 匹 配 ， 如 果 要 求 与 整个 字符 串 匹 配 的 
话 ， 则 应 该 使 用 额外 的 语法 。 
































例如 ， 我 们 的 正则 表达 式 hello|goodbye 在 Ruby 中 应 该 写成 八 A(hello| 
goodbye)\z/， 这 确保 任何 匹配 都 固定 在 字符 串 的 开始 (\A) 和 结尾 (\z) 之 间 。 











给 定 一 个 正则 表达 式 和 一 个 字符 串 ， 我 们 如 何 写 程序 决定 这 个 字符 串 是 否 与 那个 表达 式 匹 
配 呢 ? 大 多 数 的 编程 语言 ， 包 括 Ruby 在 内 ， 已 经 内 建 了 对 正则 表达 式 的 支持 ， 但 是 这 样 
的 支持 是 如 何 工 作 的 呢 ? 如 果 语 言 没 有 支持 正则 表达 式 ， 我 们 如 何 使 用 Ruby 实现 它们 呢 ? 


有 限 自 动机 完全 适合 这 个 工作 。 就 像 我 们 即将 看 到 的 ， 把 任何 正则 表达 式 转 成 一 个 等 价 
的 NFA 是 可 能 的 一 一 每 一 个 与 正则 表达 式 匹配 的 字符 串 都 能 被 这 人 台 NFA 接受 ， 反 过 来 
也 一 样 一 一 把 字符 串 输 入 给 一 台 模 拟 的 NFA 看 它 是 否 能 被 接受 ， 从 而 判断 字符 串 是 否 与 
正则 表达 式 匹配 。 用 第 2 章 的 话说 ， 我 们 可 以 把 这 个 看 成 是 为 正则 表达 式 提 供 了 一 种 指称 
语义 : 我 们 不 一 定 知道 如 何 直 接 执行 一 个 正则 表达 式 ， 但 是 可 以 展示 如 何 把 它 表 示 成 一 台 
NFA， 并 且 因 为 有 了 NFA 的 操作 语义 (“通过 读 取 字符 然后 执行 规则 改变 状态 ”)， 所 以 可 
以 执行 这 个 指称 (denotation) 实现 同样 的 结果 。 















































3.3.1 语法 
让 我 们 明确 一 下 “正则 表达 式 ” 是 什么 意思 。 下 面 是 两 种 极其 简单 的 正则 表达 式 ， 它 们 已 
经 没 法 更 简单 了 。 


























。 一 个 空 的 正则 表达 式 。 与 空 字 符 匹 配 ， 没 有 别 的 可 匹配 的 了 。 

。 一 个 只 含有 一 个 字符 的 正则 表达 式 。 例 如 ，a 和 b 是 分 别 只 能 匹配 'a" 和 'b' 的 正则 表 
达 式 。 

有 了 这 几 种 简单 的 模式 之 后 ， 我 们 有 三 种 方式 可 以 把 它们 结合 起 来 构造 更 复杂 的 表达 式 .。 


。 连接 两 个 模式 。 我 们 可 以 把 正则 表达 式 a 和 b 连接 起 来 得 到 正则 表达 式 ab， 它 只 与 字 
符 串 'ab' 匹配 。 

。 在 两 个 模式 之 间 选 择 ， 使 用 运算 符 | 把 它们 联结 起 来 。 我 们 可 以 把 正则 表达 式 a 或 b 联 
结 在 一 起 得 到 a|b， 它 与 字符 串 'a" 和 'b' 匹配 。 

。 重复 一 个 模式 零 次 或 者 多 次 ， 写 法 是 加 上 运算 符 * 作为 后 级 。 我 们 可 以 给 正则 表达 式 a 
加 上 后 绥 得 到 a*, 它 与 字符 串 'a' 、'aa' 、'aaa' 等 匹配 ,当然 也 与 空 字符 串 “ 匹配 (也 
就 是 说 重复 零 次 ) 。 
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现实 中 的 正则 表达 式 引 擎 〈 比 如 构建 到 Ruby 当中 的 )， 支 持 更 多 的 特性 。 为 
ww 4、 了 简单 起 见 ， 我 们 不 会 尝试 实现 这 些 额 外 的 特性 ， 它 们 中 有 很 多 从 学 术 上 讲 
”多 余 ， 只 是 为 了 方便 才 提 供 的 。 














例如 ， 省 略 运算 符 ? 和 + 没有 什么 太 大 区 别 ， 因 为 它们 的 作用 (分 别 为 “ 重 
复 一 或 者 零 次 ”和 “重复 一 或 者 多 次 ") 很 容易 使 用 已 有 的 特性 实现 : 正则 
表达 式 ab? 可 以 重 写成 abla， 而 模式 ab+ 与 abb* 匹配 同样 的 字符 串 。 基 他 
计数 重复 (如 a{2,5}) 和 字符 组 (如 [abc]) 等 方便 的 特性 也 是 这 样 。 





























捕获 组 (capture group)、 反 向 引用 (backreference) 以 及 先行 /后 行 断言 
(lookahead/lookbehind assertion) 这 样 的 高 级 特性 已 经 超出 了 本 章 的 讲述 范围 。 








为 了 使 用 Ruby 实现 这 个 语法 ,我们 可 以 为 每 类 正则 表达 式 定义 一 个 类 ， 并 使 用 这 些 类 的 
实例 表示 任何 正则 表达 式 的 抽象 语法 树 ， 就 像 在 第 2 章 里 处 理 Simple 表达 式 一 样 : 





module Pattern 
def bracket(outer precedence) 
if precedence < outer precedence 
'("+tos+')' 
else 
tO: s 
end 
end 


def inspect 
"/#{self}/" 
end 
end 


class Empty 
include Pattern 


def to_s 

end 

def precedence 
3 

end 


end 


class Literal < Struct.new(:character) 
include Pattern 


def to_s 
character 


end 


def precedence 


Wu 





end 
end 


class Concatenate < Struct.new(:first, :second) 
include Pattern 


def to s 
[first，second].map { |pattern| pattern.bracket(precedence) }.join 
end 


def precedence 
1 
end 
end 


class Choose < Struct.new(:first, :second) 
include Pattern 


def to s 
[first，second].map { |pattern| pattern.bracket(precedence) }.join('|') 
end 


def precedence 
0 
end 
end 


class Repeat < Struct.new(:pattern) 
include Pattern 


def to s 
pattern.bracket(precedence) + '*" 
end 


def precedence 
2 
end 
end 


在 算术 表达 式 中 乘法 对 它 参 数 的 绑 定 比 加 法 要 更 紧 (1+2 x 3 等 于 7， 而 不 是 
9)， 同 样 ， 这 个 约定 也 适用 于 正则 表达 式 的 语法 ， 它 的 * 运算 符 也 比 串联 运 
算 符 绑 定 得 更 紧 ， 而 串联 运算 符 又 比 | 运算 符 绑 定 得 紧 。 例 如 ， 在 正则 表达 
式 .abc* 中 , * 只 会 应 用 到 c 上 ("abc'、"abcc'、 "abccc )， 而 为 了 让 它 
能 应 用 到 整个 abc 上 ('abc'、'abcabc' ) ， 需 要 加 上 括号 写成 (abc)*。 














语法 类 的 实现 其 os 和 Pattern#bracket 方法 一 起 ,会 在 必要 的 时 候 自 动 插 
入 括号 ， 这 样 在 查看 一 棵 抽象 语法 树 的 简单 字符 串 表 示 时 ， 我 们 也 能 知道 它 
的 结构 信息 。 
































有 了 这 些 类 ， 我 们 就 可 以 手工 构建 表示 正则 表达 式 的 树 ; 
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>> pattern = 
Repeat .new( 
Choose.new( 
Concatenate.new(Literal.new('a'), Literal.new('b')), 
Literal.new('a') 


) 
) 
=> /(ab|a)*/ 


当然 ， 在 实际 的 实现 中 ， 我 们 不 会 手工 构建 这 些 树 ， 而 会 使 用 语法 解析 器 构建 它们 ， 可 以 


参考 3.3.3 节 。 


3.3.2 语义 


既然 我 们 可 以 把 正则 表达 式 语法 表示 成 Ruby 对象 组 成 的 树 ， 那 么 如 何 把 这 个 语法 转换 成 
NFA 呢 ? 


我 们 需要 知道 每 个 语法 类 的 实例 应 该 如 何 转换 成 NFA。 转 换 起 来 最 简单 的 类 是 Empty， 应 
该 总 是 把 它 转 换 成 一 个 状态 的 NFA， 这 个 NFA 只 接受 空 字符 串 : 


-O 


类 似 地 ， 我 们 应 该 把 任何 单字 符 的 模式 转换 成 只 接受 包含 那个 字符 的 、 单 字符 串 的 NFA。 


下 面 是 模式 a 的 NFA: 
-© 


为 Empty 和 Literal 实现 批 o_nfa_design 方法 来 生成 这 些 NFA 相当 容易 : 




















class Empty 
def to nfa design 
start_state = Object.new 
accept states = [start state] 
rulebook = NFARulebook.new([]) 


NFADesign.new(start state, accept states, rulebook) 
end 
end 


class Literal 
def to nfa design 
start_state = Object.new 
accept_state = Object.new 
rule = FARule.new(start state, character, accept state) 
rulebook = NFARulebook.new([rule]) 
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NFADesign.new(start state, [accept state], rulebook) 
end 


end 





可 以 检查 


>> 
=> 
>> 
=> 
>> 
=> 
>> 
=> 
>> 
=> 
>> 
=> 
>> 
=> 


这 里 有 


mo 


en 


这 样 我 们 就 可 以 直接 用 模式 匹配 字符 串 : 


>> 
=> 
>> 
=> 





et 3.1.4 节 提 到 过 ， 用 Ruby 对 象 实现 自动 机 时 ， 状 态 对 象 彼此 之 间 一 定 要 能 区 
心 。 分 。 这 里 没有 使 用 数字 〈 如 Fixnum 实例 ) 作为 状态 ， 而 是 使 用 了 新 创建 的 
4 


”object 实例 。 


这 是 为 了 每 一 个 NFA 都 能 有 它 自 己 独一无二 的 状态 ， 以 便 把 小 的 机 器 组 合 
成 大 的 机 器 ， 而 不 会 意外 把 它们 的 状态 也 进行 归并 。 例 如 ， 如 果 两 个 不 同 的 
NFA 都 使 用 Ruby 的 Fixnum 对 象 1 作为 状态 ， 在 保持 它们 两 个 状态 独立 的 
情况 下 ， 它 们 不 能 合 到 一 起 。 但 是 我 们 将 来 会 需要 能 进行 这 样 的 合并 ， 以 便 
能 实现 更 复杂 的 正则 表达 式 。 














类 似 地 ， 我 们 不 会 继续 在 图 上 为 状态 打 标 记 ， 这 样 以 后 把 图 连 到 一 起 时 也 不 
重新 对 其 进行 标记 。 




















查 由 Empty 和 Literal 正则 表达 式 生 成 的 NFA 能 否 接受 我 们 想 要 它 接受 的 字符 串 : 


nfa_design = Empty.new.to nfa design 
#<struct NFADesign ...> 

nfa_ design.accepts?("') 

true 

nfa design.accepts?("'a') 

false 

nfa design = Literal.new('a').to nfa design 
#<struct NFADesign ...> 

nfa_ design.accepts?("') 

false 

nfa_ design.accepts?("'a') 

true 

nfa_design.accepts?('b') 

false 


机 会 可 以 把 枇 o_nfa_design 封装 进 #matches? 方法 ， 让 模式 有 一 个 更 友好 的 接口 : 


dule Pattern 
def matches?(string) 
to nfa design.accepts?(string) 
end 
d 





Empty.new.matches?('a') 

false 
Literal.new('a').matches?("a') 
true 
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既然 我 们 知道 如 何 把 简单 的 Empty 和 Literal 正则 表达 式 转 成 NFA 了 ， 那 对 Concatenate 
串联 ) 、Choose (选择 ) 和 Repeat (重复 ) 也 需要 类 似 的 进行 转换 。 





一 、 





从 Concatenate 开始 : 如 果 有 两 个 已 经 知道 如 何 转换 成 NFA 的 正则 表达 式 ， 那 么 如 何 构造 
一 个 NFA 表示 这 些 正则 表达 式 的 串联 呢 ? 举 个 例子 ， 假 如 能 把 单个 字符 的 正则 表达 式 a 
和 b 转换 成 NFA， 那 怎么 把 ab 转 成 一 个 NFA 呢 ? 





对 于 ab， 我 们 可 以 把 两 个 NFA 按 顺 序 连 接 到 一 起 ， 用 自由 移动 把 它们 联结 在 一 起 ， 并 且 
保留 第 二 个 NFA 的 接受 状态 : 


-OO “ -0O*O 
光 


这 个 技术 在 其 他 情况 下 也 行 得 通 。 任 意 两 个 NFA 的 连接 ， 都 可 以 先 把 第 一 个 NFA 的 每 一 
个 接受 状态 转 成 非 接受 状态 ， 再 通过 自由 有 移动 把 它 与 第 二 个 NFA 的 开始 状态 连接 。 如 
果 一 串 输 入 能 让 原来 第 一 台 NFA 进入 接受 状态 ， 串 联 起 来 的 机 器 读 入 这 串 输入 之 后 就 能 
自发 的 进入 到 原来 第 二 个 NFA 的 起 始 状态 ， 然 后 通过 读 取 一 串 原 来 第 二 个 NFA 能 接受 的 
输入 ， 它 将 到 达 自 己 的 接受 状态 。 


OO 




















全 


因此 ， 组合 机 器 的 原材料 是 : 


。 第 一 个 NFA 的 起 始 状 态 ; 
。 第 二 个 NFA 的 接受 状态 ; 
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。 两 台 NFA 的 所 有 规则 ; 
。 一 些 额外 的 自由 移动 ， 可 以 把 第 一 台 NFA 旧 的 接受 状态 与 第 二 个 NFA 旧 的 起 始 状态 连 
接 起 来 。 


可 以 把 


cl. 


en 


这 上段 代 


这 个 想法 转换 成 Concatenate#to_nfa_design 的 实现 : 


ass Concatenate 

def to nfa design 
first nfa design = first.to nfa design 
second nfa design = second.to nfa design 


start state = first nfa design.start state 

accept_states = second nfa design.accept states 

rules = first nfa design.rulebook.rules + second nfa design.rulebook.rules 

extra rules = first nfa design.accept states.map { |statel| 
FARule.new(state, nil, second nfa design.start state) 


rulebook = NFARulebook.new(rules + extra rules) 


NFADesign.new(start state, accept states, rulebook) 


end 
d 
码 首先 把 第 一 和 第 二 个 正则 表达 式 转 换 成 NFADesign， 然 后 把 它们 的 状态 和 规则 用 合 





适 的 方式 组 合 到 一 起 构成 新 的 NFADesign。ab 这 种 简单 的 情况 是 没有 问题 的 : 


pattern = Concatenate.new(Literal.new('a'), Literal.new('b')) 
/ab/ 

pattern.matches?('a') 

false 

pattern.matches?('ab') 

true 

pattern.matches?('abc') 

false 





这 个 转换 过 程 是 递归 的 (Concatenate#to_nfa_design 对 其 他 对 象 调用 其 o_nfa_design)， 


因此 对 
(a 与 b 


>> 


[2 





联 


Hd 





于 像 abc 这 样 的 更 深 媒 套 的 正则 表达 式 也 能 正常 工作 ， 这 种 情况 下 将 包含 两 次 
串联 然后 与 < 串联 ) : 


pattern = 
Concatenate .new( 
Literal.new('a' )， 
Concatenate.new(Literal.new('b'), Literal.new('c')) 
) 
/abc/ 
pattern.matches?('a') 
false 
pattern.matches?('ab') 
false 
pattern.matches?('abc') 
true 
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赚 六 


这 又 是 一 个 组 合 型 指称 语义 的 例子 复合 正则 表达 式 的 NFA 指称 由 它 每 一 
4 4 ， 部 分 NFA 的 指称 组 成 。 
DS 
我 们 可 以 使 用 同样 的 策略 把 Choose 表达 式 转 成 一 台 NFA。 在 最 简单 的 情况 下 ， 正 则 表达 
式 a 和 b 的 NFA 能 结合 起 来 构造 成 正则 表达 式 alb 的 NFA， 方 法 是 增加 一 个 新 的 起 始 状 
态 并 使 用 自由 移动 把 它 与 两 台 原 始 机 器 之 前 的 起 始 状态 连接 起 来 : 


-O*O :—O*O 














在 alb NFA 读 取 任 何 输入 之 前 ， 它 可 以 自由 移动 进入 任何 一 个 原始 机 器 的 起 始 状态 ， 再 从 
这 个 状态 开始 读 取 'a' 或 者 'b' 从 而 到 达 一 个 接受 状态 。 通 过 增加 一 个 新 的 起 始 状态 和 两 
个 自由 移动 ， 把 任意 两 台 机 器 连 到 一 起 很 简单 


-OO 








A) 
-0 





Oo 
| 
证 
Lu 
贡 





在 这 种 情况 下 ， 组 合 机 器 的 原材料 是 : 


。 一 个 新 的 起 始 状 态 ， 

。 两 台 NFA 的 所 有 接受 状态 ; 

。 两 台 NFA 的 所 有 规则 ; 

。 两 个 额外 的 自由 移动 ， 可 以 把 新 的 起 始 状态 与 NFA 旧 的 起 始 状 态 连 接 起 来 。 








实现 Choose#to_nfa_design 仍然 不 难 : 


class Choose 
def to nfa design 


first nfa design = first.to nfa design 
second nfa design = second.to nfa design 


start_state = Object.new 

accept states = first nfa design.accept states + second nfa design.accept states 

rules = first nfa design.rulebook.rules + second nfa design.rulebook.rules 

extra rules = [first nfa design, second nfa design].map { |nfa design| 
FARule.new(start state, nil, nfa design.start state) 


} 


rulebook = NFARulebook.new(rules + extra rules) 


NFADesign.new(start state, accept states, rulebook) 


end 


end 


这 个 实现 很 好 : 


>> 
=> 
>> 
=> 
>> 
=> 
>> 
=> 


pattern = Choose.new(Literal.new('a'), Literal.new('b')) 
/alb/ 

pattern.matches?('a') 

true 

pattern.matches?('b') 

true 

pattern.matches?('c') 

false 





最 后 ， 我 们 开始 讨论 Repeat: 如何 把 与 一 个 字符 串 匹 配 的 NFA， 转 换 成 能 匹配 同一 个 字 


符 串 重复 零 次 或 者 更 多 次 的 NFA 呢 ? 我 们 为 a* 构造 一 个 NFA， 其 开头 是 一 个 a 对 应 的 
NFA， 然 后 做 两 个 补充 : 








。 从 它 的 接受 状态 到 开始 状态 增加 一 个 自由 移动 ， 这 样 它 就 可 以 与 多 于 一 个 'a' 匹配 了 ， 
。 增加 一 个 可 自由 移动 到 旧 的 开始 状态 的 新 状态 ， 并 且 使 其 作为 接受 状态 ， 这 样 它 就 可 以 
匹配 空 字符 串 了 。 





图 示 如 下 : 





最 简单 的 计算 机 | 83 





a 
一 人 (六 (人 零 次 或 多 次 





从 旧 的 接受 状态 得 到 旧 的 起 始 状态 的 自由 移动 ， 能 让 机 器 进行 多 次 匹配 而 不 是 只 匹配 一 次 
(aa 、'aaa' 等 )， 并 且 新 的 起 始 状 态 允 许 它 匹配 空 字符 串 而 不 会 影响 它 能 接受 的 其 他 字 
符 串 %。 对 任何 的 NFA 我 们 都 可 以 一 样 处 理 ， 只 要 通过 自由 移动 把 每 一 个 旧 的 接受 状态 和 
旧 的 起 始 状态 连接 起 来 即 可 : 


合 ' 寺 ae 

















这 次 我 们 需要 : 

。 一 个 新 的 起 始 状 态 ， 它 也 是 一 个 接受 状态 ; 

。 旧 的 NFA 中 所 有 的 接受 状态 ; 

。 旧 的 NFA 中 所 有 的 规则 ; 

。 一 些 额 外 的 自由 移动 ， 把 旧 NFA 的 每 一 个 接受 状态 与 旧 的 起 始 状态 连接 起 来 ; 
。 男 一 些 自由 移动 ， 把 新 的 起 始 状态 与 旧 的 起 始 状态 连接 起 来 。 


让 我 们 把 这 些 转换 成 代码 : 





注 5: 在 这 种 简单 的 情况 下 ， 我 们 可 以 只 把 原始 的 起 始 状 态 转 成 一 个 接受 状态 ， 而 不 增加 新 状态 。 但 是 在 更 
复杂 的 情况 下 (例如 (axb)*) ， 这 种 技术 可 能 会 产生 一 台 接 受 除 了 空 字符 串 外 其 他 一 些 不 想 要 字符 惠 
的 机 器 。 
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cl. 


en 


然后 检 


既然 每 
并 用 它 


>> 


ass Repeat 
def to nfa design 
pattern nfa design = pattern.to nfa design 


start_state = Object.new 
accept states = pattern nfa design.accept states + [start state] 
rules = pattern nfa design.rulebook.rules 
extra_ rules = 
pattern nfa design.accept states.map { |accept statel| 
FARule.new(accept state, nil, pattern nfa design.start state) 
}+ 
[FARule.new(start state, nil, pattern nfa design.start state)] 
rulebook = NFARulebook.new(rules + extra rules) 


NFADesign.new(start state, accept states, rulebook) 
end 
d 


查 结果 : 


pattern = Repeat.new(Literal.new('a')) 
/a*/ 

pattern.matches?("'') 

true 

pattern.matches?('a') 

true 

pattern.matches?('aaaa') 

true 

pattern.matches?('b') 

false 


个 正则 表达 式 语 法 类 都 已 经 有 了 所 o_nfa_design 实现 ， 下 面 就 可 以 构建 复杂 的 模式 
们 匹配 字符 串 了 : 


pattern = 
Repeat .new( 
Concatenate.new( 
Literal.new('a'), 
Choose.new(Empty.new, Literal.new('b')) 


) 


) 
/(a(|b))*/ 
pattern.matches?("') 
true 
pattern.matches?('a') 
true 
pattern.matches?('ab') 
true 
pattern.matches?('aba') 
true 
pattern.matches?('abab') 
true 
pattern.matches?('abaab') 
true 
pattern.matches?('abba') 
false 





最 简单 的 计算 机 | 85 





这 个 结果 很 好 。 我 们 从 模式 的 语法 开始 ， 然 后 展示 如 何 把 任意 模式 转换 成 一 台 NFA， 而 
NFA 是 我 们 已 经 知道 如 何 执行 的 抽象 机 器 ， 这 样 就 拥有 了 这 种 语法 的 语义 。 再 配 上 一 个 语 
法 解析 器 ， 我 们 就 有 了 一 种 实用 的 方法 ， 可 以 读 取 正则 表达 式 并 决定 它 是 否 与 某 个 特定 的 
字符 串 匹 配 。 对 这 种 方法 自由 移动 非常 有 用 ， 因 为 它们 能 把 小 一 些 的 机 器 组 合成 更 大 的 机 
器 ， 并 且 不 会 影响 其 中 任何 组 成 部 分 的 行为 。 











寺 sa 


、 现实 中 多 数 正则 表达 式 实现 (如 Ruby 使 用 的 Onigmo 库 ) 的 工作 方式 都 不 

心 是 照 字 面 把 模式 编译 到 有 限 自动 机 然后 模拟 它们 执行 。 尽 管 这 种 方法 在 对 字 

必 ， 符 串 进 行 正则 表达 式 匹 配 时 快 而 且 高 效 ， 但 是 在 支持 更 高 级 的 特性 ， 如 捕 

获 组 (capture groups) 和 先行 /后 行 断 言 (lookahead/lookbehind assertions ) 

时 ， 会 困难 得 多 。 因 此 ， 大 多 数 的 库 都 使 用 某 种 回溯 算法 (backtracking 
algorithm ) 更 直接 地 处 理 正则 表达 式 ， 而 不 是 把 它们 转换 成 有 限 自 动机 。 









































Russ Cox 的 RE2 库 (http://code.google.com/p/re2/) 是 一 个 产品 质量 级 别 的 
C++ 正则 表达 式 实现 ， 它 不 把 模式 编译 成 自动 机 “， 而 Pat Shaughnessy 已 经 
写 了 一 篇 很 详细 的 博客 (http://patshaughnessy.net/2012/4/3/exploring-rubys- 
regular-expression-algorithm ) ， 来 探索 Ruby 正则 表达 式 如 何 工 作 。 











3.3.3 解析 

我 们 几乎 构建 了 一 个 完整 的 《虽然 很 基本 ) 正则 表达 式 实现 。 唯 一 缺失 的 是 一 个 模式 
语法 的 语法 解析 器 :如果 我 们 只 需要 写 (a(|b))# 而 不 是 通过 Repeat.new(Concatenate. 
new(Literal.new('a')，Choose.new(Empty.new，Literal.new('b')))) 手工 地 构建 出 抽象 语 
法 树 就 方便 多 了 。 我 们 在 2.6 节 中 看 到 使 用 Treetop 生成 一 个 语法 解析 器 并 不 困难 ， 它 能 把 
原始 语法 自动 转换 成 一 个 AST (抽象 语法 树 )， 因 此 下 面 也 这 样 做 来 完成 我 们 的 实现 。 


看 是 一 个 简单 正则 表达 式 的 Treetop 语法 : 























下 











grammar Pattern 
rule choose 


first:concatenate or empty '|' rest:choose { 

def to ast 
Choose.new(first.to ast, rest.to ast) 

end 

} 

/ 

concatenate or empty 

end 


rule concatenate or empty 
concatenate / empty 
end 





注 6: RE2 的 口号 是 “一 个 高 效 的、 条 理化 的 正则 表达 式 库 ”， 这 很 难 反 驱 。 
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rule concatenate 
first:repeat rest:concatenate { 
def to ast 
Concatenate.new(first.to ast, rest.to ast) 
end 
} 
/ 
repeat 
end 


rule empty 
Li { 
def to ast 
Empty .new 
end 


} 


end 


rule repeat 
brackets '*' { 
def to ast 
Repeat.new(brackets.to ast) 
end 
} 
brackets 
end 


rule brackets 
'(' choose ')' { 
def to ast 
choose.to ast 
end 
} 
/ 
literal 
end 


rule literal 
[a-z] { 
def to ast 
Literal.new(text value) 
end 


规则 的 顺序 又 一 次 反映 了 每 一 个 运算 符 的 优先 级 : 运算 符 的 优先 级 从 上 到 下 越 
。 来 越 高 ，| 运算 符 的 绑 定 最 宽松 ， 因 此 choose 规则 在 最 前 面 。 














现在 我 们 分 析 一 个 正则 表达 式 ， 把 它 转 换 成 一 个 抽象 语法 树 ， 并 使 用 它 匹 配 字符 串 所 需 
的 条 件 已 经 全 部 俱 备 : 
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>> require “trTeetop 

=> true 

>> Treetop.load('pattern') 

=> Patternparser 

>> parse tree = Patternparser.new.parse(' (a(|b))*"') 

=> SyntaxNode+Repeat1+Repeat0 offset=0, "(a(|b))*" (to ast,brackets): 
SyntaxNode+BTackets1+BTackets0 offset=0, "(a(|b))" (to ast,choose): 

SyntaxNode offset=0, "(" 

SyntaxNode+Concatenate1+Concatenate0 offset=1, "a(|b)" (to ast,first,rest): 
SyntaxNode+Literal0 offset=1, "a" (to ast) 
SyntaxNode+BTackets1+BTackets0 offset=2, "(|b)" (to ast,choose): 

SyntaxNode offset=2, "(" 
SyntaxNode+Choose1+Choose0 offset=3, "|b" (to ast,first,rest): 
SyntaxNode+Empty0 offset=3, "" (to ast) 
SyntaxNode offset=3, "|" 
SyntaxNode+Literal0 offset=4, "b" (to ast) 
SyntaxNode offset=5, ")" 
SyntaxNode offset=6, ")" 
SyntaxNode offset=7, "*" 
>> pattern = parse tree.to ast 
=> /(a(|b))*/ 
>> pattern.matches?('abaab') 
=> true 
>> pattern.matches?('abba') 
=> false 


3.4 等 价 性 


本 章 已 经 描述 了 确定 性 状态 机 的 思想 ， 并 且 为 它 增 加 了 更 多 特性 。 首 先是 非 确定 性 ， 在 设 
计 机 器 时 它 能 提供 很 多 可 能 的 执行 路 径 。 还 有 自由 移动 ， 它 让 非 确 定性 的 机 器 无 需 读 取 任 
何 输 入 就 可 以 改变 状态 。 

非 确 定性 和 自由 移动 让 设计 有 限 状 态 机 执行 特定 的 工作 更 容易 一 一 我 们 已 经 看 到 它们 在 把 下 
则 表达 式 转换 成 状态 机 时 非常 有 用 一 一 但 它们 为 我 们 做 了 什么 标准 DFA 不 能 做 的 事情 吗 ? 
把 任何 非 确定 性 有 限 自 动机 转 成 接受 完全 相同 字符 串 的 确定 性 自动 机 是 可 能 的 。 考 虑 到 一 
台 DFA 的 额外 约束 ， 这 可 能 有 些 令 人 吃 尺 。 但 在 思 芳 一 下 我 们 对 两 种 机 器 执行 的 模拟 方 
式 之 后 ， 这 就 能 讲 得 通 了 。 











假如 我 们 要 模拟 一 台 特 定 DFA 的 行为 。 对 这 个 假想 DFA 读 取 一 个 特定 字符 序列 的 模拟 可 


能 会 是 这 样 : 


。 机 器 读 取 任何 输入 之 前 ， 它 处 于 状态 1; 

。 机 器 读 取 字 符 'a' ， 那 么 它 现 在 处 于 状态 2， 

。 机 器 读 取 字 符 'b' ， 那 么 它 现在 处 于 状态 3; 

。 不 再 有 输入 ， 而 且 状态 3 是 一 个 接受 状态 ， 所 以 字符 串 'ab' 已 经 被 接受 。 








这 里 有 一 些 很 微妙 的 东西 :模拟 在 重新 创造 着 DFA 的 行为 。 在 我 们 的 例子 里 ， 模 拟 是 运行 
在 一 台 真 实 计算 机 上 的 Ruby 程序 ， 而 DFA 则 是 无 法 运行 的 一 台 抽 象 机 器 ， 因 为 它 根本 不 存 
在 。 每 当 假想 的 DFA 改变 状态 的 时 候 ， 正 在 运行 的 模拟 也 要 改变 一 一 因此 才 称 其 为 模拟 。 


很 难 把 DFA 和 它 的 模拟 分 开 ， 因 为 它们 都 是 确定 性 的 ， 而 且 它 们 的 状态 完全 匹配 : DFA 
处 于 状态 2 的 时 候 ， 模 拟 也 处 于 一 个 能 表明 “这 台 DFA 处 于 状态 2” 的 状态。 在 我 们 的 
Ruby 模拟 中 ， 这 个 模拟 状态 实际 上 就 是 DFA 实例 的 current_state 属性 值 。 























尽管 在 处 理 非 确定 性 和 自动 移动 时 有 额外 的 开销 ， 但 对 一 个 假想 的 NFA 读 取 字符 串 进 行 
模拟 并 没有 什么 大 的 不 同 。 





。 机 器 读 取 任何 输入 之 前 ， 它 可 能 处 于 状态 1 或 者 状态 3。 

。 机 器 读 取 字 符 c， 那 么 现在 它 可 能 处 于 状态 1、3 或 者 4 中 的 一 个 。 

。 机 器 读 取 字 符 d， 那 么 现在 它 可 能 处 于 状态 2 或 者 状态 5 中 的 一 个 。 

。 不 再 有 输入 ， 并 且 状 态 5 是 一 个 接受 状态 ， 因 此 字符 串 “cd' 已 经 被 接受 。 


模拟 的 状态 与 NFA 的 状态 不 一 样 ， 这 一 点 此 时 更 容易 看 出 来 。 事 实 上 ， 在 模拟 的 每 一 点 
上 ， 我 们 一 直 都 无 法 确定 NFA 那 时 处 于 什么 状态 。 但 是 模拟 本 身 仍 然 是 确定 性 的 ， 因 为 
它 的 状态 能 够 适应 这 种 不 确定 性 。 在 NFA 可 能 处 于 状态 1、3 或 者 4 中 一 个 的 时 候 ， 我 们 
可 以 肯定 模拟 现在 处 于 一 个 表示 “NFA 处 于 状态 1、3 或 者 4” 的 某 一 个 确定 状态 。 

















这 两 个 例子 的 唯一 真正 区 别 是 ，DFA 的 模拟 是 从 一 个 当前 状态 移动 到 另 一 个 ， 而 NEFA 的 
模拟 是 从 一 个 当前 可 能 状态 的 集合 移动 到 另 一 个 可 能 状态 的 集合 。 尽 管 一 个 NFA 的 规则 
手册 可 以 是 非 确定 性 的 ， 但 是 对 于 一 个 给 定 的 输入 从 当前 状态 出 发 移动 到 哪些 状态 ， 这 个 
决定 总 是 完全 确定 性 的 。 














这 种 确定 性 意味 着 我 们 总 可 以 构造 一 台 DFA 来 模拟 一 台 特 定 的 NFA。 这 人 台 DFA 有 一 个 状 
态 表示 这 台 NFA 的 每 一 个 可 能 状态 的 集合 ， 并 且 DFA 状态 之 间 移 动 的 规则 对 应 着 NFA 
的 确定 性 模拟 在 它 可 能 状态 的 集合 之 间 的 移动 方式 。 这 台 DFA 将 能 够 完全 模拟 NFA 的 行 
为 ,并且 只 要 为 DFA 选择 合适 的 接受 状态 一 一 根据 我 们 的 Ruby 实现 ， 这 些 将 是 与 处 于 接 
受 状态 的 NFA 对 应 的 任何 状态 一 一 它 也 将 接受 同样 的 字符 串 。 


让 我 们 尝试 着 为 一 台 特 定 的 NFA 做 这 种 转换 。 以 下 面 这 个 为 例 : 























也 
- 
如 


管 一 台 NFA 只 有 一 个 起 始 状态 ， 但 自由 移动 使 得 读 取 任 何 输入 之 前 进入 其 他 状态 成 为 可 能 。 
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在 没有 读 取 任 何 输入 之 前 ， 这 台 NFA 可 能 处 于 状态 1 或 者 状态 2 (状态 1 是 起 始 状态 ， 而 
状态 2 可 以 通过 自由 移动 到 达 )， 因 此 模拟 将 从 可 以 叫 作 “1 或 者 2” 的 状态 开始 。 从 这 个 
起 点 出 发 ， 根 据 它 读 到 的 是 a 或 b， 模 拟 将 会 在 不 同 的 状态 终止 。 





。 如 有 果 读 到 a， 模 拟 仍 将 保持 在 状态 “1 或 者 2”: NFA 处 于 状态 1 时 它 可 以 读 入 a， 然 后 
或 是 维持 在 状态 1 或 是 进入 状态 2， 而 从 状态 2 开始 ， 它 没 法 再 读 入 a 了 。 

如 果 读 到 b, NFA 可 能 会 终止 于 状态 2 或 者 状态 3 (从 状态 1 开始 ), 它 不 能 再 读 到 b 了 ， 
但 是 从 状态 2 开始 ， 它 可 以 移动 到 状态 3 并 且 还 可 能 自由 移动 回 状 态 2， 因 此 ， 我 们 说 
输入 为 b 的 时 候 ， 模 拟 将 移动 到 叫 作 “2 或 者 3” 的 状态 。 

















通过 思考 一 个 NFA 模拟 的 行为 ， 我 们 可 以 为 这 个 模拟 构造 一 台 状 态 机 : 

















4 “2 或 者 3” 是 模拟 的 一 个 接受 状态 ， 因 为 状态 3 是 NFA 的 一 个 接受 状态 。 


DS 





可 以 继续 这 个 过 程 发 现 模拟 的 更 多 新 状态 ， 直 到 不 再 有 新 发 现 为 止 。 因 为 原始 NFA 的 状 
态 只 有 有 限 数 目的 可 能 组 合 ， 所 以 最 后 肯定 能 停止 发 现 。* 通过 重复 对 示例 NFA 的 发 现 过 
程 ， 我 们 发现 从 “1 或 者 2” 出 发 然后 读 取 a 和 b 的 序列 ， 它 的 模拟 只 能 碰 到 四 种 不 同 的 
状态 组 合 : 

















如 果 NFA 处 于 状态 …… 并 且 读 入 字符 …… 它 可 能 终止 于 状态 …… 
1 或 2 a 1 或 2 
b 2 或 3 
2 或 3 a 无 
b 1、2 或 3 
无 a 无 
b 无 
1、2 或 3 a 1 或 2 
b 1、2 或 3 


此 表 完 整地 描述 了 一 台 DFA， 如 下 图 所 示 ， 它 与 原始 的 NFA 接受 同样 的 字符 串 : 








注 8， 模 拟 一 个 三 状态 的 NEA 时 ,最 差 情况 是 “1” “2” “3” “1 或 者 2" “1 或 者 3" “2 或 者 3" “1 2 或 者 3 
和 “无 ”。 
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a 
b 
-@ 


这 个 DFA 只 比 我 们 开始 的 NFA 多 出 一 个 状态 ,而 且 对 于 一 些 NFA， 这 个 过 

心 。 程 可 能 会 产生 比 原 始 机 器 的 状态 更 少 的 DFA。 但 是 在 最 坏 情况 下 ， 一 台 有 7 

“个 状态 的 NFA 可 能 需要 一 台 有 > 个 状态 的 DFA， 因 为 n 个 状态 总 共有 "个 
可 能 组 合 (考虑 把 每 个 组 合 都 表示 成 一 个 n 比特 的 数字 ， 其 中 第 nn 个 比特 表 
示 状 态 n 是否 包含 在 这 个 组 合 中 )， 并 且 模 拟 可 能 需要 访问 其 中 所 有 的 组 合 
而 不 仅仅 是 其 中 一 部 分 。 





























下 面 我 们 用 Ruby 实现 这 个 NFA 到 DFA 的 转换 。 策 略 是 引入 一 个 新 的 类 NFASimulation， 用 
来 收集 NFA 模拟 的 信息 然后 把 这 些 信息 汇总 成 一 台 DFA 。NFASimulation 根据 特定 的 
NFADesign 创建 ， 并 且 最 后 提供 一 个 镀 o_dfa_design 方法 把 它 转换 成 等 价 的 DFADesign。 


我 们 已 经 有 了 可 以 模拟 NFA 的 NFA 类 ， 因 此 NFASimulation 可 以 创建 NFA 的 实例 ， 然 后 操 
纵 这 个 实例 弄 清 楚 对 所 有 可 能 的 输入 它们 都 是 如 何 响应 的 。 在 开始 写 NFASimulation 之 前 ， 
我 们 先 回 到 NFADesign 并 且 给 NFADesign#to_nfa 增加 一 个 可 选 的 参数 “当前 状态 "， 这 样 就 
可 以 使 用 任意 集合 的 当前 状态 构建 一 台 NFA， 而 不 是 只 能 使 用 NFADesgin 的 起 始 状态 : 

















class NFADesign 
def to nfa(current states = Set[start statel]) 
NFA.new(current states, accept states, rulebook) 
end 
end 


此 前 ,一 台 NFA 的 模拟 只 能 从 它 的 起 始 状态 开始 ， 但 这 个 新 的 参数 让 它 可 以 从 其 他 任何 
点 起 步 : 





>> rulebook = NFARulebook.new([ 
FARule.new(1, 'a', 1), FARule.new(1, 'a', 2), FARule.new(1, ni], 2), 
FARule.new(2, 'b', 3), 
FARule.new(3, 'b', 1), FARule.new(3, nil, 2) 
]) 
=> #<struct NFARulebook rules=[...]> 
>> nfa design = NFADesign.new(1, [3], rulebook) 
=> #<struct NFADesign start state=1, accept states=[3], rulebook=...> 
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>> nfa_design.to_nfa.cuTrTent_states 

=> #<Set: {1, 2}> 

>> nfa_design.to nfa(Set[2]).current_states 
=> #<Set: {2}> 

>> nfa design.to nfa(Set[3]).current states 
=> #<Set: {3, 2}> 


峙 人 


这 个 NFA 类 自动 把 自由 移动 考虑 进来 了 一 一 可 以 看 到 NFA 从 状态 3 开始 的 
心 。 时 候 ， 无 需 读 取 任何 输入 它 就 可 能 处 于 状态 2 或 者 3。 因 此 为 了 支持 自由 移 
尾 ， 动 ， 我 们 不 用 做 任何 特别 的 事情 。 

















现在 我 们 可 以 用 任何 可 能 状态 的 集合 创建 一 台 NFA， 向 其 输入 一 个 字符 ， 然 后 看 它 最 终 可 
能 处 于 什么 状态 。 这 是 把 一 台 NFA 转换 成 一 台 DFA 重要 的 一 步 。 在 NFA 处 于 状态 2 或 
者 3 并 且 读 入 一 个 b 的 时 候 ， 之 后 它 可 能 处 于 什么 状态 呢 ? 





>> nfa = nfa_design.to_nfa(Set[2，3] ) 

=> #<struct NFA current states=#<Set: {2, 3}>, accept states=[3], rulebook=...> 
>> nfa.read character('b'); nfa.current states 

=> #<Set: {3, 1, 2}> 


答案 是 状态 1、2 或 者 3， 就 像 我 们 在 手工 转换 过 程 中 发 现 的 那样 。( 请 记 住 ,集合 中 元 素 
的 顺序 没关系 。) 


让 我 们 使 用 这 个 思想 创建 NFASimulation 类 ， 给 它 增加 一 个 方法 计算 模拟 的 状态 如 何 根据 
某 一 个 特定 的 输入 而 改变 。 我 们 把 模拟 的 状态 看 成 这 台 NFA 当前 可 能 状态 的 集合 (例如 
“1、2 或 者 3”)， 因 此 可 以 写 一 个 #next_state 方法， 以 一 个 模拟 的 状态 和 一 个 字符 为 参 
数 ， 把 这 个 字符 传递 给 对 应 那个 状态 的 一 台 NFA， 之 后 通过 监视 这 台 NFA 得 到 一 个 新 的 
状态 : 





class NFASimulation < Struct.new(:nfa design) 
def next state(state, character) 
nfa design.to nfa(state).tap { |nfal 
nfa.read character(character) 
}.current states 
end 
end 





这 里 讨论 的 两 种 状态 很 容易 让 人 感到 迷惑 。 模 拟 的 一 个 状态 
-Ee (NFASimulation#next_state 的 state 参数 ) 是 许多 NFA 状态 的 一 个 集合 ， 这 
是 为 什么 我 们 可 以 把 它 作 为 NFADesign#to_nfa 的 current_states 参数 的 原因 。 














这 让 我 们 可 以 很 方便 地 考察 模拟 的 不 同 状 态 : 


>> simulation = NFASimulation.new(nfa_design) 
=> #<struct NFASimulation nfa design=...> 
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>> simulation.next state(Set[1, 2], 'a') 

=> #<Set: {1, 2}> 

>> simulation.next state(Set[1, 2], 'b') 

=> #<Set: {3, 2}> 

>> simulation.next state(Set[3, 2], 'b') 

=> #<Set: {1, 3, 2}> 

>> simulation.next_state(Set[1, 3, 2], 'b') 
=> #<Set: {1, 3, 2}> 

>> simulation.next_state(Set[1, 3, 2], 'a') 
=> #<Set: {1, 2}> 


现在 需要 一 种 方式 能 系统 地 考察 模拟 的 状态 并 把 我 们 的 发 现 记录 成 一 台 DFA 的 状态 
和 规则 。 我 们 打算 直接 使 用 每 个 模拟 的 状态 作为 一 个 DFA 状态 ， 因 此 第 一 步 是 实现 
NFASimulation#rules_for， 它 使 用 #next_state 发 现 每 一 个 规则 的 目的 状态 ， 从 一 个 特定 
的 模拟 状态 出 发 构建 出 全 部 规则 。 "全 部 规则 ”意味 着 它 是 对 每 一 个 可 能 的 输入 字符 适用 
的 一 个 规则 ， 因 此 我 们 还 定义 了 辅助 方法 NFARulebook#alphabet 来 了 解 原始 的 NFA 可 以 














读 取 哪些 字符 ， 


class NFARulebook 
def alphabet 
rules.map(&:character).compact.uniq 
end 
end 


class NFASimulation 
def rules for(state) 
nfa_design.rulebook.alphabet.map { |character| 
FARule.new(state, character, next state(state, character)) 
} 
end 
end 


如 预期 一 样 ， 这 让 我 们 看 到 了 在 不 同 的 状态 之 间 不 同 的 输入 将 会 如 何 模 拟 : 





>> rulebook.alphabet 
=> ["a", "b"] 
>> simulation.rules for(Set[1, 2]) 
= | 
#<FARule #<Set: {1, 2}> --a--> #<Set: {1, 2}>>, 
#<FARule #<Set: {1, 2}> --b--> #<Set: {3, 2}>> 
] 
>> simulation.rules for(Set[3, 2]) 
a || 
#<FARule #<Set: {3, 2}> --a--> #<Set: {}>>, 
#<FARule #<Set: {3, 2}> --b--> #<Set: {1, 3, 2}>> 
] 





方法 #rules_for 让 我 们 可 以 通过 已 知 的 模拟 状态 发 现 新 的 状态 ， 并 且 通 过 反复 对 其 执行 ， 
我 们 可 以 找到 所 有 可 能 的 模拟 状态 。 我 们 可 以 使 用 NFASimulation#discover_states_and_ 
rules 方法 ， 它 采用 类 似 NFARulebook#follow free_moves 的 方法 递归 找到 更 多 的 状态 。 
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class NFASimulation 
def discover states and rules(states) 
rules = states.flat map { |state| rules for(state) } 
more_states = rules.map(&:follow).to set 


if more states.subset?(states) 
[states, rules] 
else 
discover states and rules(states + more states) 
end 
end 
end 





#discover_states_and_rules 并 不 关心 模拟 状态 背后 的 状态 ， 而 只 有 这 个 状 
一 态 才 能 用 作 抽 ule_for 的 参数 。 但 是 作为 程序 员 ， 还 有 一 个 地 方 可 能 让 我 们 
困惑 。 变 量 states 和 more_states 是 模拟 状态 的 集合 ， 但 是 我 们 知道 每 一 个 
模拟 状态 本 身 是 一 个 NFA 状态 的 集合 ， 因 此 states 和 more_states 实际 上 
是 NFA 状态 集合 的 集合 











最 初 ， 我 们 只 知道 模拟 的 一 个 状态 : NFA 进入 起 始 状态 时 的 可 能 状态 集合 。#discover_ 
states_and_rules 从 这 个 起 点 开始 探索 ， 最 终 找 到 所 有 的 4 个 状态 和 模拟 的 8 个 规则 : 
>> start_state = nfa_design.to nfa.current states 


=> #<Set: {1, 2}> 
>> simulation.discover states and rules(Set[start state]) 


= 站 

#<Set: { 
#<Set: {1, 2}>, 
#<Set: {3，2}>， 
#<Set: {}>， 
#<Set: {1, 3, 2}> 

}>, 

[ 
#<FARule #<Set: {1, 2}> --a--> #<Set: {1, 2}>>, 
#<FARule #<Set: {1, 2}> --b--> #<Set: {3, 2}>>, 
#<FARule #<Set: {3, 2}> --a--> #<Set: {}>>, 
#<FARule #<Set: {3, 2}> --b--> #<Set: {1, 3, 2}>>, 
#<FARule #<Set: {}> --a--> #<Set: {}>>， 
#<FARule #<Set: {}> --b--> #<Set: {}>>， 
#<FARule #<Set: {1, 3, 2}> --a--> #<Set: {1, 2}>>, 
#<FARule #<Set: {1, 3, 2}> --b--> #<Set: {1, 3, 2}>> 

] 


] 


最 后 我 们 要 知道 的 是 ， 每 一 个 模拟 状态 是 否 应 该 被 处 理 成 一 个 接受 状态 ， 但 是 在 模拟 中 很 
容易 通过 查询 NFA 得 到 结果 : 














>> nfa_design.to nfa(Set[1, 2]).accepting? 
=> false 
>> nfa design.to nfa(Set[2, 3]).accepting? 





=> true 





既然 我 们 有 了 模拟 DFA 的 所 有 部 件 ， 现 在 只 需 一 个 NFASimulation#to_dfa_design 方法 把 
它们 封装 成 一 个 DFADesign 实例 : 


class NFASimulation 
def to dfa design 
start state = nfa design.to nfa.current states 
states, rules = discover states and rules(Set[start statel]) 
accept states = states.select { |state| nfa design.to nfa(state).accepting? } 


DFADesign.new(start state, accept states, DFARulebook.new(rules)) 
end 
end 


就 这 样 。 我 们 可 以 使 用 任何 NFA 构造 一 个 NFASimulation 实例 ， 并 把 它 转换 成 一 个 接受 同 
样 字符 串 的 DFA: 





>> dfa design = simulation.to dfa design 
=> #<struct DFADesign ...> 

>> dfa design.accepts?('aaa') 

=> false 

>> dfa_design.accepts?('aab') 

=> true 

>> dfa_design.accepts?('bbbabb') 

=> true 


棒 极 了 1 


在 本 节 的 开始 ， 我 们 问 过 NFA 的 额外 特性 是 否 能 做 一 台 DFA 完成 不 了 的 事情 。 现 在 很 明 
显 答 案 为 否 ， 因 为 如 果 任 何 NFA 都 可 以 转 成 一 台 做 同样 工作 的 DFA， 那 么 NFA 就 不 会 有 
额外 的 能 力 。 非 确定 性 和 自由 移动 只 是 一 台 DFA 已 经 能 做 的 工作 的 再 包装 ， 就 像 编程 语 
言 里 中 的 语法 糖 一 样 ， 它 们 不 是 让 我 们 超越 确定 性 约束 的 新 能 


理论 上 说 ,为 一 台 简 单 的 机 器 增加 更 多 的 特性 却 没 有 为 它 根本 上 增加 更 多 的 能 力 非常 有 
趣 ， 但 实际 上 这 是 很 有 用 的 ， 因 为 一 台 DFA 比 一 台 NFA 更 容易 模拟 : 只 有 一 个 当前 状态 
要 跟踪 ， 并 且 一 台 DFA 用 硬件 或 者 机 器 代码 实现 起 来 足够 简单 ， 可 以 使 用 程序 存储 位 置 
作为 状态 ， 用 条 件 分 支 作 为 规则 。 这 意味 着 一 个 正则 表达 式 的 实现 可 以 把 一 个 模式 先 转 换 
成 一 台 NFA 然后 再 转换 成 一 台 DFA， 得 到 一 台 能 被 快速 高 效 模拟 的 非常 简单 的 机 器 。 
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DFA 最 小 化 


一 些 DFA 的 特性 是 最 小 化 的 ， 就 是 说 无 法 设计 出 一 台 能 接受 同样 字符 串 但 是 状态 更 少 
的 DFA。NFA 到 DFA 的 转换 过 程 有 时 候 会 产生 包含 宛 余 状态 的 非 最 小 化 DFA， 但 是 
有 一 种 优雅 的 方式 可 以 去 除 这 种 宛 余 ， 叫 作 Brzozowski 算法 。 


(1) 从 你 的 非 最 小 化 DFA 开始 。 

(2) 反 转 所 有 规则 。 从 形象 的 表示 上 说 ， 这 意味 着 表示 机 器 的 图 上 每 一 个 箭头 都 保持 
原 位 但 是 方向 反 转 ; 从 代码 上 说 ， 每 一 个 FARule.new(state， character， next 
state) 被 替换 成 FARule.new(next_state,character， state)。 反 转 规 则 通常 会 打破 
确定 性 约束 ， 因 此 现在 你 有 了 一 台 NFA。 

(3) 交换 起 始 状 态 和 接受 状态 的 角色 : 起 始 状 态 成 为 接受 状态 ， 而 每 一 个 接受 状态 成 为 
一 个 起 始 状态 。( 因 为 一 台 NFA 只 有 一 个 起 始 状态 ， 所 以 你 不 能 直接 把 所 有 的 接受 
状态 变 成 起 始 状态 ， 但 是 你 可 以 创建 一 个 新 的 起 始 状态 ， 然 后 通过 自由 移动 把 它 与 
每 一 个 旧 的 接受 状态 连接 起 来 ， 这 样 效 果 是 一 样 的 。) 

(4) 把 这 个 反 转 的 NFA 按 通常 方式 转换 成 一 台 DFA。 


奇怪 的 是 ， 这 样 得 到 的 DFA 保证 是 最 小 的 而 且 不 含 宛 余 状 态 。 遗 憾 的 缺点 是 它 只 能 
接受 原始 DFA 字符 串 的 颠倒 版 本 : 如 果 我 们 原始 的 DFA 接受 字符 串 'ab'、'aab'、 
"aaab' 等 ， 那 这 个 最 小 化 的 DFA 将 接受 'ba'、'baa' 和 'baaa' 形式 的 字符 囊 。 修 正 
方法 是 简单 地 第 二 次 执行 整个 过 程 ， 从 反 转 的 DFA 开始 再 得 到 一 个 二 次 反 转 的 DFA， 
它 还 能 保证 是 最 小 的 ， 但 这 次 能 接受 与 我 们 开始 的 那 台 机 器 一 样 的 字符 事 了 。 


能 有 一 种 自动 的 方法 去 除 设 计 中 的 完 余 是 很 美好 的 。 但 有 趣 的 是 ， 一 台 最 小 化 的 DFA 
也 是 标准 的 : 接受 完全 相同 字符 串 的 任何 两 台 DFA 将 最 小 化 成 为 同样 的 机 器 ， 因 此 我 
们 可 以 把 两 台 NFA 最 小 化 然后 比较 结果 看 它们 结构 是 否 相 同 ， 以 此 来 检查 两 台 DFA 
是 否 等 价 。 "这 反 过 来 提供 了 一 种 优雅 的 方法 ， 可 以 检查 两 个 正则 表达 式 是 否 等 价 ; 如 
果 我 们 把 与 同一 个 字符 串 匹 配 的 两 个 模式 〈 例 如 ab(ab)# 和 a(ba)*b) 转换 成 NFA， 
把 这 些 NFA 转 成 DFA， 然 后 把 两 台 DFA 使 用 Brzozowski 算法 最 小 化 ， 最 终 将 得 到 两 
台 看 起 来 一 样 的 机 器 。 








注 


9: 解决 这 个 图 的 同 构 问 题 本 身 要 求 一 个 聪明 的 算法 ， 但 非 正 式 地 检查 两 台 机 器 的 结构 图 并 确定 它们 是 否 
“相同 ” 却 足 够 简单 。 
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| 第 3 章 





第 4 章 
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第 3 章 探 讨 了 有 限 自 动机 ， 这 是 一 种 假想 的 机 器 ， 它 去 掉 了 真实 计算 机 的 复杂 性 并 把 其 规 
约 成 了 最 简单 的 形式 。 我 们 详细 考察 了 这 些 机 器 的 行为 并 了 解 了 它们 的 用 处 ， 而 且 还 发 
现 ， 非 确定 性 有 限 自动 机 虽然 有 一 些 奇特 的 执行 方法 ， 但 计算 能 力 并 不 比 确 定性 有 限 自动 
机 强 。 


我 们 没 法 通过 为 有 限 自 动机 增加 非 确定 性 和 自由 移动 这 种 奇特 的 特性 来 提高 它 的 计算 能 
力 。 这 个 事实 表明 ， 我 们 已 经 停留 在 这 些 简单 机 器 的 计算 水 平 上 无 法 前 进 了 。 而 且 如 果 
不 从 根本 上 改变 机 器 的 工作 方式 ， 将 无 法 脱离 这 种 停 谐 不 前 的 境地 。 那 么 ， 所 有 这 些 机 
器 到 底 有 多 强 的 能 力 呢 ”好 吧 ， 没 有 多 少 能 力 。 它 们 被 限制 在 非常 有 限 的 应 用 上 (只 能 
妆 受 或 者 拒绝 字符 序列 )， 而 且 即 使 在 这 么 小 的 范围 内 ,仍然 很 容易 碰 到 机 器 无 法 识别 的 


语言 。 


举 个 例子 ， 假 设 要 设计 一 台 有 限 自动 机 ， 要 求 它 能 读 取 带 有 左右 括号 的 字符 串 ， 并 且 只 
字符 串 中 的 左右 括号 是 平衡 的 ( 即 每 一 个 右 括号 都 能 在 字符 囊 中 找到 与 其 匹配 的 左 括号 )， 
它 才 会 接受 。， 

解决 这 个 问题 的 一 般 策略 是 一 次 读 取 一 个 字符 ， 同 时 跟踪 一 个 表示 当前 底 套 级 别 的 数字 : 
读 入 一 个 左 括号 时 增加 民 套 级 别 ， 读 人 一 个 右 括号 时 降低 伐 套 级 别 。 只 要 供 套 级 别 到 零 
了 ， 就 表示 当前 读 到 的 这 些 括号 已 经 都 匹配 上 了 (因为 堪 套 级 别 增加 和 减少 的 数量 是 一 
样 的 )， 并 且 如 果 我 们 试图 把 嵌 套 级 别 降低 到 小 于 零 的 值 ， 那 就 表明 当前 的 右 括号 多 了 












































注 1: 这 与 接受 仅 包 含 同 样 数量 的 左右 括号 的 字符 串 完 全 不 同 。 字 符 串 '()' 和 ')(' 都 有 一 个 左 括号 和 一 个 
右 括 号 ,但 只 有 '()' 是 平衡 的 。 
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(如 "\)) )， 不 管 还 有 什么 字符 没有 读 取 ， 字 符 串 里 的 括号 一 定 已 经 不 平衡 了 。 
作为 一 个 良好 的 开始 ， 我 们 可 以 为 这 个 任务 设计 一 台 NFA。 下 面 是 拥有 四 个 状态 的 NFA: 


-0 


每 个 状态 都 对 应 一 个 内 套 级 别 ， 读 取 一 个 左 括号 或 者 一 个 右 括 号 会 分 别 让 机 器 转移 到 与 更 
高 或 者 更 低级 别 对 应 的 状态 ,“ 设 有 肯 套 ”对 应 的 就 是 接受 状态 。 我 们 已 经 实现 了 用 Ruby 
模拟 这 台 NFA 所 需要 的 一 切 ， 因 此 来 运行 一 下 : 























>> rulebook = NFARulebook.new([ 

FARule.new(0, '(', 1), FARule.new(1, ')', 0), 

FARule.new(1, '(', 2), FARule.new(2, ')', 1), 

FARule.new(2, '(', 3), FARule.new(3, ')', 2) 

]) 

=> #<struct NFARulebook rules=[...]> 
>> nfa design = NFADesign.new(0, [0], rulebook) 
=> #<struct NFADesign start state=0, accept states=[0], rulebook=...> 


对 于 某 些 输入 ， 我 们 的 NFA 工作 得 很 好 。 它 能 确定 '(()' 和 '())' 的 括号 不 平衡 ， 而 
'《())' 的 括号 是 平衡 的 ， 它 甚至 能 识别 '(() (QO0()))' 这 种 更 为 复杂 的 平衡 字符 串 : 





>> nfa design.accepts?('(()') 

=> false 

>> nfa design.accepts?('())') 

=> false 

>> nfa design.accepts?('(())') 

=> true 

>> nfa design.accepts?('(()(()()))') 
=> true 


可 是 这 种 设计 有 一 个 严重 的 缺陷 : 如果 括号 的 舱 套 等 级 超过 3， 它 就 会 失败 。 它 没有 足够 
多 的 状态 跟踪 '(((())))' 这 样 的 字符 串 的 岁 套 ， 因 此 即使 括号 明显 是 平衡 的 它 也 会 拒绝 : 








>> nfa design.accepts?('(((())))') 
=> false 


我 们 可 以 通过 临时 增加 更 多 的 状态 来 修正 此 问题 。 一 台 拥 有 5 个 状态 的 NFA 可 以 识别 任 
意 嵌 套 级 别 小 于 5 的 平衡 字符 串 ， 而 一 台 拥 有 10 个 、100 个 或 者 1000 个 状态 的 NFA， 可 
以 识别 嵌 套 级 别 在 机 器 硬 限制 以 内 的 任意 平衡 字符 串 。 但 是 ， 我 们 如 何 设计 支持 任意 山 套 
级 别 、 能 识别 任意 平衡 字符 串 的 NFA 呢 ? 结论 是 设计 不 出 来 : 一 台 有 限 自动 机 的 状态 数 
总 是 有 限 的 ， 因 此 任何 机 器 能 支持 的 能 套 级 别 也 总 是 有 限 的 ， 我 们 只 要 提供 一 个 比 它 能 处 
理 的 虑 套 级 别 多 一 级 的 字符 串 ， 它 就 无 法 处 理 了 。 












































根本 问题 是 一 台 有 限 














自动 机 只 有 固定 的 状态 集合 ， 因 而 其 存储 是 有 限 的 ， 因 此 没 法 跟踪 


任意 数量 的 信息 。 在 平衡 字符 串 问 题 当中 ， 一 台 NFA 很 容易 递增 到 设计 时 限制 的 某 个 最 


大 数目 ， 但 无 法 继续 计数 以 适应 任何 可 能 大 小 的 输入 。 "本质 上 大 小 固 





定 的 任务 (比如 对 


字符 串 'abc' 进行 匹配 )， 或 者 无 需 跟 踪 重 复 次 数 的 任务 (比如 对 正则 表达 式 ab*c 进行 匹 





配 )， 
重用 的 场景 下 ， 这 个 问题 会 让 有 限 自 动机 无 能 为 力 。 





都 不 受 这 个 问题 的 影响 ， 但 在 信息 数目 不 可 预知 ， 需 要 在 计算 过 程 中 存储 并 在 之 后 








正则 表达 式 和 谍 套 字符 串 


我 们 已 经 看 到 ， 有 限 自动 机 与 正则 表达 式 关 系 密切 。3.3.2 节 展 示 了 如 何 把 任意 一 个 正 
则 表达 式 转 换 成 一 台 NFA， 并 且 实 际 上 还 有 一 个 算法 可 以 把 任意 NFA 转换 回 一 个 正 
则 表达 式 。 这 告诉 我 们 正则 表达 式 与 NFA 等 价 并 且 拥 有 同样 的 限制 ， 因 此 也 不 可 能 
使 用 正则 表达 式 识别 括号 组 成 的 平衡 字符 事 ， 也 不 能 识别 所 有 定义 中 军 涉 谋 套 任意 深 
度 配 对 情况 的 语言 。 

关于 这 个 缺点 ， 最 知名 的 例子 就 是 正则 表达 式 无 法 区 分 有 效 HTML 和 无 效 HTML 
(http://stackoverflow.com/a/1732454) 这 一 事实 。 许 多 HTML 元 素 要 求 开 闭 标记 成 对 
出 现 ， 而 这 些 标记 自身 还 可 能 封装 着 其 他 元 素 ， 因 此 有 限 自 动机 没有 足够 的 能 力 读 取 
HTML 字符 串 ， 并 同时 跟踪 哪些 标记 没有 配 上 对 以 及 它们 识 套 的 深度 是 多 少 。 

但 实际 上 ， 现 实 世 界 中 的 “正则 表达 式 ” 库 经 常 超 越 正则 表达 式 理论 上 所 拥有 的 能 
Ruby 的 Regexp 对 象 提 供 的 很 多 特性 都 不 在 正则 表达 式 的 形式 定义 当中 ， 而 且 这 些 特 
性 提供 的 额外 能 力 可 以 识别 更 多 语言 。 

Regexp 加 强 的 一 点 就 是 可 以 把 一 个 子 表达 式 用 (?《1ame>) 语法 标记 ， 然 后 在 别 的 地 方 
使 用 \g<1ame>“ 调 用 ”这 个 子 表达 式 。 能 够 引用 自己 的 子 表达 式 ， 这 使 得 一 个 Regexp 
能 够 递归 调用 自身 ,这 让 匹配 任意 深度 的 成 对 吝 套 成 为 可 能 。 

侈 如， 尽管 NFA 不 能 匹配 括号 的 平衡 字符 事 (因此 理论 上 说 正则 表达 式 也 不 能 )， 但 
子 表达 式 调 用 允许 我 们 写 出 匹配 这 种 字符 串 的 RegXp。 下 面 就 是 这 个 Regxp 的 样子 : 





























balanced = 
/ 
\A # 匹配 开始 于 字符 串 的 开头 
(?<brackets>  # 叫 作 “"brackets" 的 子 表达 式 开始 
\( # 匹配 左 括号 
\g<brackets>* # 匹配 子 表达 式 "brackets" 零 次 或 者 多 次 
\) # 匹配 右 括号 














注 2: 这 并 不 是 说 一 个 输入 字符 串 真 的 可 以 是 无 限 的 ， 只 是 说 我 们 可 以 根据 需要 让 它 尽 可 能 有 限 地 大 。 














注 3: 简单 地 说 ， 这 个 算法 通过 把 一 台 NFA 转换 成 广义 非 确定 性 有 限 自 动机 (GNFA) 来 完成 工作 。GNFA 


是 这 样 一 种 有 限 状 态 机 ， 每 一 个 规则 都 用 一 个 正则 表达 式 标记 (而 不 是 用 一 个 字符 标记 ) ， 然 后 不 断 
合并 这 台 GNFA 的 状态 和 规则 ， 直 到 只 剩 下 两 个 状态 和 一 个 规则 为 止 。 最 后 剩 下 的 规则 上 标记 的 正 














则 表达 式 总 是 与 原始 NFA 匹配 相同 的 字符 串 。 
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) # 子 表达 式 结束 
。 # 重复 整个 模式 零 次 或 多 次 
\z # 匹配 结束 于 字符 串 的 结尾 








子 表达 式 〈?《brackets>...) 匹配 一 对 开 闭 括号 ， 但 在 括号 内 ， 它 还 能 匹配 任意 次 数 的 
自身 ， 因 此 整个 模式 可 以 正确 识别 谋 套 任意 深度 的 括号 : 


> [ (0 ()) (Os (OOON), ed th ].grep(balanced) 
> [ (OO) "(OOON)Y, CCCON NN NN) 


这 种 方式 能 行 ， 只 是 因为 Ruby 的 正则 表达 式 引 党 使 用 了 调用 栈 跟 踪 (?<brackets>...)， 
这 是 DFA 和 NFA 不 能 做 到 的 。 下 一 节 里 ， 我 们 将 看 到 如 何 扩展 有 限 自 动机 ， 让 它 也 
获得 这 种 能 

是 的 ， 你 也 可 以 用 同样 的 思想 写 一 个 Regxp 匹配 网 套 的 HIML 标记 ， 但 肯定 不 值得 花 
这 个 时 间 。 











很 明显 这 些 机 器 的 能 力 存 在 局 限 性 。 如 果 非 确定 性 不 足以 让 有 限 自动 机 能 力 更 强 ， 那 什么 
才能 赋予 它 更 多 的 能 力 呢 ? 现 在 的 问题 来 源 是 机 器 有 限 的 存储 ， 因 此 我 们 可 以 增加 一 些 存 
储 看 看 怎么 样 。 


a 8 三 
4.1 确定 性 下 推 自动 机 

为 了 解决 存储 问题 ， 我 们 可 以 使 用 专门 的 原始 空间 扩展 有 限 状 态 自动 机 ， 它 负责 在 计算 
过 程 中 存储 数据 。 除 状态 提供 的 有 限 内 部 存储 之 外 ， 这 个 空间 给 了 机 器 一 种 外 部 存储 
(external memory)。 就 像 我 们 将 会 发 现 的 那样 ， 拥 有 外 部 存储 对 于 一 台 机 器 的 计算 能 力 关 
系 重大 。 


4.1.1 存储 

为 有 限 自动 机 增加 存储 的 简单 方式 就 是 让 它 可 以 访 . 栈 ， 这 是 一 个 后 进 先 出 的 数据 结构 ， 可 
以 把 字符 推 和 和 弹出 。 栈 是 简单 而 且 有 限制 也 企 任意 时 间 都 只 有 顶端 的 字符 可 
以 访问 。 为 了 查 明 栈 下 面 位 置 的 数据 ， 我 们 只 We 而 一 旦 向 栈 内 推 人 一 串 字 
符 ， 我 们 就 只 能 按 相 反 的 顺序 把 它们 弹出 一 一 但 它 确实 可 以 很 好 地 解决 有 限 存储 的 问题 。 对 
于 栈 的 大 小 并 没有 内 在 的 限制 ， 因 此 原则 上 它 可 以 根据 需要 存储 数据 。” 






































自 带 栈 的 有 限 状 态 机 叫 作 下 推 自动 机 (PushDown Automaton，PDA)， 如 果 这 人 台 机 器 的 
规则 是 确定 性 的 ， 我 们 就 叫 它 确定 性 下 推 自动 机 (Deterministic PushDown Automaton， 





注 4: 当然 ， 栈 在 现实 世界 中 的 任何 实现 都 受 限 于 计算 机 的 RAM， 或 者 硬盘 上 的 空闲 空间 ， 或 者 宇宙 中 原 
子 的 数量 ， 但 是 对 于 思维 实验 ， 我 们 将 认为 这 些 约束 都 不 存在 。 











DPDA)。 能 对 栈 进行 访问 带 来 了 新 的 可 能 性 ， 例 如 ， 很 容易 设计 一 台 DPDA 来 识别 括号 
组 成 的 平衡 字符 串 。 下 面 是 它 的 工作 方式 。 


。 给 机 器 两 个 状态 : 1 和 2， 状 态 1 作为 接受 状态 。 

。 状态 1 作为 机 器 的 起 始 状 态 ， 此 时 栈 为 空 。 

。 如 有 果 处 于 状态 1 并 且 读 入 一 个 左 括号 ， 就 把 某 个 字符 一 一 我 们 使 用 b 表示 “括号 ”一 一 
入 栈 ， 并 转移 到 状态 2。 

。 如 果 处 于 状态 2 并 且 读 入 一 个 左 括 号 ， 就 把 字符 b 和 人 栈 。 

。 如 果 处 于 状态 2 并且 读 入 一 个 右 括号 ， 就 把 字符 b 从 栈 中 弹出 。 

。 如 果 处 于 状态 2 且 栈 为 空 ， 就 转移 回 状态 1。 

这 台 DPDA 使 用 栈 的 大 小 来 记录 到 目前 为 止 没 有 配 上 对 的 左 括号 数目 。 栈 为 空 时 ， 意 味 着 

每 一 个 左 括号 都 已 经 匹配 上 了 右 括号 ， 因 此 字符 串 一 定 是 平衡 的 。 我 们 观察 一 下 机 器 读 入 

字符 串 '(()(()()))' 时 栈 的 增长 和 缩减 情况 : 




















状态 是 否 接 受 栈 的 内 容 剩余 输入 动作 

1 是 (0(O00)) 读 入 (， 推 信 b， 转 移 到 状态 2 
2 否 b 0(00)) 读 入 (, 推 人 b 
2 否 bb )(()())) 读 入 )， 弹 出 
有 否 b (()0O)) 读 入 (， 推 人 b 
2 否 bb ()())) 读 和 人 (,， 推 人 b 
2 否 bbb )())) 读 入 )， 弹 出 b 
2 否 bb 0)) 读 入 (, 推 人 b 
2 否 bbb ))) 读 入 ),， 弹出 b 
2 否 bb )) 读 入 ),， 弹出 b 
否 b ) 读 入 )， 弹 出 b 
2 否 转移 到 状态 1 
1 是 四 


4.1.2 规则 
括号 平衡 问题 DPDA 背后 的 思想 非常 简单 ， 但 在 我 们 实际 构建 它 之 前 ， 需 要 弄 清 楚 一 些 技 
术 细 节 。 首 先 ， 我 们 必须 确定 下 推 自动 机 的 工作 规则 。 这 里 有 几 个 设计 问题 。 


。 每 个 规则 都 要 修改 栈 ， 或 者 读 取 输 入 ， 或 者 改变 状态 ， 还 是 三 者 都 要 做 ? 
。 推 人 和 弹出 需要 两 种 不 同 的 规则 吗 ? 

。 栈 为 空 时 ， 我 们 是 否 需 要 一 种 特殊 的 规则 改变 状态 呢 ? 

。 就 像 NFA 中 的 自由 移动 那样 ， 没 有 从 输入 读 取 就 改变 状态 是 否 可 以 呢 ? 
。 如 果 一 台 DPDA 可 以 自发 改变 状态 ， 那 “确定 性 ”是 什么 意思 呢 ? 











通过 选择 一 种 足够 灵活 、 能 满足 所 有 要 求 的 规则 类 型 ， 我 们 可 以 回答 全 部 问题 。 我 们 把 一 
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个 PDA 规则 分 成 5 部 分 : 


。 机 器 的 当前 状态 ; 

。 必须 从 输入 读 取 的 字符 (可 选 ) ， 

。 机 器 的 下 一 个 状态 ; 

。 必须 从 栈 中 弹出 的 字符 ， 

。 栈 顶 字符 弹出 后 需要 推 入 栈 中 的 字符 序列 。 


前 三 部 分 很 熟悉 ， 它 们 来 自 DFA 和 NFA 的 规则 。 如 果 一 个 规则 不 想 让 机 器 改变 状态 ， 它 
可 以 让 下 一 个 状态 与 当前 状态 一 样 ， 如 果 它 不 想 读 取 任何 输入 (也 就 是 自由 移动 )， 则 可 
以 忽略 输入 字符 ， 只 要 这 不 让 机 器 变 成 非 确 定性 的 就 可 以 (参见 4.1.3 节 )。 


其 他 两 部 分 一 一 要 弹出 的 字符 和 要 推 入 的 字符 序列 一 一 是 PDA 特有 的 。 假 定 一 台 PDA 总 
是 要 弹出 栈 顶 字符 ， 然 后 向 栈 中 推 和 人 其 他 字符 。 每 一 个 规则 声明 它 想 要 弹出 哪个 字符 ， 然 
后 这 个 规则 只 会 在 这 个 字符 处 于 栈 顶 位 置 时 才 会 应 用 ， 如 果 这 个 规则 想 让 那个 字符 留 在 栈 
中 而 不 弹出 ， 它 可 以 把 这 个 字符 包含 在 后 来 要 推 入 栈 中 的 字符 序列 当中 。 


这 个 五 部 分 的 规则 格式 没有 说 明 栈 为 空 时 如 何 写 规则 ， 但 我 们 可 以 通过 选择 一 个 特殊 符号 
标记 栈 底 位 置 来 解决 一 一 流行 的 选择 是 9 一 一 然后 每 当 想 要 检测 栈 是 否 为 空 时 ， 检 查 这 个 
符号 就 可 以 了 。 使 用 这 个 约定 时 ， 最 重要 的 是 永远 不 要 让 栈 真 的 变 空 ， 因 为 在 栈 顶 为 空 时 
没有 规则 可 以 应 用 。 机 器 开始 的 时 候 这 个 特殊 的 栈 底 符号 应 该 已 经 在 栈 中 ， 任 何 规则 在 把 
这 个 符号 弹出 之 后 必须 再 次 把 它 推 入 。 












































很 容易 用 这 种 格式 重 写 平衡 括号 的 DPDA 规则 : 


。 处 于 状态 1 而 且 读 入 左 括号 时 ， 弹 出 字符 $， 推 入 字符 史 ， 然 后 转移 到 状态 2; 

。 处 于 状态 2 而 且 读 入 左 括号 时 ， 弹 出 字符 b， 推 入 字符 bb， 然后 保持 在 状态 2; 

。 处 于 状态 2 而 且 读 入 右 括 号 时 ， 弹 出 字符 b， 不 推 入 任何 字符 ， 然 后 保持 在 状态 2 
。 处 于 状态 2 (没有 读 入 任何 字符 ) 时 ， 弹 出 字符 $， 推 人 字符 $， 然 后 转移 到 状态 1。 








我 们 可 以 用 这 个 机 器 的 图 来 展示 这 些 规则 。DPDA 图 看 起 来 与 NFA 图 很 像 但 DPDA 图 
的 每 个 箭头 不 仅 要 标记 它 从 输入 读 取 的 字符 ， 还 要 标记 这 个 规则 需要 弹出 和 推 和 的 字符 。 
如 果 我 们 使 用 符号 a;b/cd 来 标记 一 个 规则 ， 它 表明 从 输入 读 取 a， 从 栈 中 弹出 b， 然 后 向 
栈 中 推 和 人 cd， 这 个 机 器 看 起 来 像 是 这 样 : 























(;b/bb 
);b/ 








4.1.3 ”确定 性 

下 一 个 难题 就 是 为 PDA 准确 地 定义 确定 性 的 含义 。 对 于 DFA 来 说 ， 我 们 的 约束 是 “不 能 
存在 冲突 ”: 不 能 在 任何 状态 上 ， 由 于 冲突 的 规则 而 使 机 器 的 下 一 次 移动 有 二 义 性 。 这 也 
适用 于 DPDA， 例 如 ， 在 机 器 处 于 状态 2、 下 一 个 输入 字符 是 左 括号 并 且 栈 顶 是 b 的 时 候 ， 
我 们 只 能 应 用 一 个 规则 。 甚 至 写 一 个 不 读 取 任 何 输入 的 自由 移动 规则 都 是 可 以 的 ， 只 要 对 
于 同样 的 状态 和 同样 的 栈 顶 字符 没有 其 他 规则 可 用 就 可 以 ， 因 为 这 样 在 确定 一 个 字符 是 否 
应 该 从 输入 读 取 的 时 候 会 产生 二 义 性 。 


DFA 还 有 “不 能 有 遗漏 ”的 约束 (每 一 个 可 能 的 情况 都 应 该 有 一 个 规则 )， 但 是 因为 状态 、 
输入 字符 和 栈 顶 字符 有 大 量 可 能 的 组 合 ， 所 以 这 对 于 DPDA 来 说 很 难处 理 。 通 常 只 是 忽略 
这 个 约束 并 允许 DPDA 只 定义 完成 工作 所 需 的 规则 ， 并 且 假 定 一 台 DPDA 在 没有 规则 可 
用 时 将 进入 停滞 状态 。 我 们 的 平衡 括号 DPDA 在 读 取 ') 或 '())' 这 样 的 字符 串 时 会 进入 
这 种 情况 ， 因 为 处 于 状态 1 且 读 入 一 个 右 括号 时 没有 规则 可 用 。 









































4.1.4 模拟 
既然 处 理 完 了 技术 细节 ， 让 我 们 构建 一 个 确定 性 下 推 自动 机 的 Ruby 模拟 吧 ， 这 样 就 可 以 
与 它 交互 了 。 在 模拟 DFA 和 NFA 的 时 候 我 们 已 经 完成 了 大 部 分 困难 的 工作 ， 因 此 这 次 只 
需要 微调 。 


我 们 缺少 的 最 重要 的 东西 是 栈 。 下 面 是 一 种 实现 栈 类 的 方式 : 














class Stack < Struct.new(:contents) 
def push(character) 
Stack.new([character] + contents) 
end 


def pop 
Stack.new(contents.drop(1)) 
end 


def top 
contents. first 
end 


def inspect 
"#<Stack (#{top})#{contents.drop(1).join}>" 
end 
end 





一 个 Stack 对象 把 它 的 内 容 存储 在 一 个 数组 内 并 把 简单 的 #push 和 #pop 操作 暴露 出 来 以 支 
持 字符 的 推 人 和 弹出 ， 另 外 还 有 一 个 撼 op 操作 可 以 读 取 栈 顶 的 字符 : 


>> stack = Stack.new(['a'’, 'b', 'c', 'd'", 'e']) 
=> #<Stack (a)bcde> 
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>> stack.top 

=> "a" 

>> stack.pop.pop.top 

=> "Ce" 

>> stack.push('x').push('y').top 

EF "y" 

>> stack.push('x').push('y').pop.top 

3 

江 忆 

这 仅仅 是 一 个 纯 功 能 性 的 栈 。#ipush 和 #pop 方法 是 非 破坏 性 的 : 它们 每 一 个 

心 。 都 返回 回 一 个 新 的 栈 实例 而 不 是 修改 已 有 的 栈 。 每 次 都 创建 一 个 新 的 栈 对 象 比 

全 通常 拥有 破坏 性 push 和 孝 op 方法 操作 的 栈 (如 果 我 们 想 这样 ， 可 以 直接 
使 用 Array) 效率 要 低 ， 但 是 使 用 起 来 要 更 容易 ， 因 为 在 多 处 使 用 一 个 Stack 
对 象 的 时 候 ， 我 们 不 必 担 心 对 其 进行 修改 的 后 果 。 

















第 3 章 里 ， 我 们 可 以 通过 只 跟踪 一 条 信息 来 模拟 确定 性 有 限 自动 机 ， 也 就 是 跟踪 DFA 的 
当前 状态 ， 然 后 在 每 次 从 输入 读 取 字 符 时 使 用 规则 手册 更 新 该 状态 。 但 是 关于 下 推 自动 机 
计算 的 每 一 步 有 两 件 重要 的 事情 要 知道 : 它 的 当前 状态 是 什么 ， 栈 的 当前 内 容 是 什么 。 如 
有 果 我 们 使 用 名 词 配置 表示 一 个 状态 和 一 个 栈 的 组 合 ， 则 在 下 推 自 动机 读 取 输 入 字符 时 ， 我 
们 可 以 说 它 从 一 个 配置 转移 到 了 另 一 个 配置 ， 这 上 比 总 是 需要 分 别提 到 状态 和 栈 要 容易 。 从 
这 个 角度 看 的 话 ， 一 台 DPDA 只 会 有 一 个 当前 配置 ， 并 且 每 次 读 取 一 个 字符 时 规则 手册 都 
会 告诉 我 们 如 何 把 当前 配置 转换 成 下 一 个 配置 。 


下 面 是 用 来 存储 PDA 配置 (一 个 状态 和 一 个 栈 ) 的 一 个 PDAConfiguration 类 ， 以 及 一 个 
用 来 表示 一 台 PDA 的 规则 手册 中 的 一 个 规则 的 PDARule 类 :5 





class PDAConfiguration < Struct.new(:state, :stack) 
end 


class PDARule < Struct.new(:state, :character, :next state, 
:pop_character, :push characters) 
def applies to?(configuration, character) 
self.state == configuration.state && 
self.pop_character == configuration.stack.top && 
self.character == character 
end 
end 





只 有 在 机 器 状态 、 栈 顶 字 符 和 下 一 个 输入 的 字符 都 为 期 望 值 的 时 候 才 能 应 用 规则 : 


>> rule = PDARule.new(1, '(', 2, '$', ['b', '$']) 
=> #<struct PDARule 
state=1, 














注 5: 因为 它们 的 实现 并 没有 做 任何 确定 性 的 假设 , 所 以 这 些 类 的 名 字 以 PDA 开头 ， 而 不 是 以 DPDA 开头 ， 
这 样 它们 在 模拟 非 确定 性 PDA 时 也 工作 得 很 好 。 




















character="(", 

next_state=2， 

pop_character="$", 

push_characters=["b", "$"] 

> 

>> configuration = PDAConfiguration.new(1, Stack.new(['$'])) 
=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 
>> rule.applies to?(configuration, '(') 
=> true 


对 一 台 有 限 自 动机 来 说 ， 遵 守 规 则 只 是 意味 着 从 一 个 状态 变 成 男 一 个 状态 ， 但 一 个 PDA 
规则 除了 改变 状态 之 外 还 会 更 新 栈 的 内 容 ， 因 此 PDARule#follow 需要 接受 机 器 的 当前 配置 
作为 参数 然后 返回 下 一 个 配置 : 











class PDARule 
def follow(configuration) 
PDAConfiguration.new(next_ state, next stack(configuration)) 
end 


def next_ stack(configuration) 
popped_ stack = configuration.stack.pop 


push_characters.reverse. 
inject(popped stack) { |stack, character| stack.push(character) } 











与 之 前 的 顺序 相反 : 


>> stack = Stack.new(['$']).push('x').push('y').push('z') 
=> #<Stack (z)yx$> 
>> stack.top 


‘ 如 果 我 们 把 一 些 字符 先 推 入 栈 中 然后 再 把 它们 弹出 ， 则 它们 出 来 时 的 顺序 会 
4 
' 3 





= "之 
>> stack = stack.pop; stack.top 
-=》"y" 
>> stack = stack.pop; stack.top 
wy 








PDARule#next_stack 通过 在 把 字符 推 入 栈 之 前 先 把 push_characters 反 转 的 办 
法 解决 这 个 问题 。 例 如 ，push_characters 的 最 后 一 个 字符 实际 上 是 推 入 栈 中 
的 第 一 个 字符 ,这样 再 次 弹出 的 时 候 它 就 又 是 最 后 一 个 字符 了 。 这 只 是 为 了 
方便 我 们 把 规则 的 push_characters 按照 字符 序列 读 取 (以 “弹出 的 顺序 ”)， 

些 字 符 序列 在 规则 应 用 之 后 会 出 现在 栈 顶 ， 这 样 我 们 就 不 用 关心 它们 到 达 
栈 顶 的 机 制 了 。 



































因此 ， 如 果 把 一 个 PDARule 应 用 到 一 个 PDAConfiguration 上 ， 就 可 以 通过 这 个 规则 找 出 接 
下 来 的 状态 和 栈 是 什么 样 的 : 
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>> rule.follow(configuration) 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 


这 足以 实现 DPDA 的 规则 手册 了 。 这 个 实现 与 3.1.4 市 的 DFARulebook 类 似 : 


class DPDARulebook < Struct.new(:rules) 
def next_ configuration(configuration, character) 
rule for(configuration, character).follow(configuration) 
end 


def rule for(configuration, character) 
rules.detect { |rule| rule.applies to?(configuration, character) } 
end 
end 


现在 我 们 可 以 为 平衡 括号 DPDA 汇编 一 个 规则 手册 了 ， 然 后 尝试 手工 单 步调 试 一 些 配置 和 
输入 字符 : 


>> rulebook = DPDARulebook.new([ 

PDARule.new(1, '(', 2, '$', ['b', '$']), 

PDARule.new(2, '(', 2, 'b', ['b', 'b']), 

PDARule.new(2, ')', 2, 'b', []), 

PDARule.new(2, nil, 1, '$', ['$']) 

]) 

=> #<struct DPDARulebook rules=[...]> 
>> configuration = rulebook.next_configuration(configuration, '(') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 
>> configuration = rulebook.next_configuration(configuration, '(') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)b$>> 
>> configuration = rulebook.next configuration(configuration, ')') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 


为 了 代替 手工 操作 ， 我 们 可 以 使 用 规则 手册 构建 一 个 DPDA 对 象 ， 它 会 在 从 输入 读 取 字符 的 
同时 跟踪 机 器 的 当前 配置 ; 





class DPDA < Struct.new(:current configuration, :accept states, :rulebook) 
def accepting? 
accept states.include?(current configuration.state) 
end 


def read character(character) 
self.current configuration = 
rulebook.next configuration(current configuration, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 





这 样 我 们 可 以 创建 一 个 DPDA， 提 供 输入 ， 然 后 看 它 是 否 能 够 接受 这 些 输入 : 


>> dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
=> #<struct DPDA ...> 

>> dpda.accepting? 

=> true 

>> dpda.read string('(()'); dpda.accepting? 

=> false 

>> dpda.current_ configuration 

=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 


到 目前 为 止 一 切 都 很 好 ， 但 我 们 正在 使 用 的 规则 手册 中 包含 一 个 自由 移动 ， 因 此 模拟 需要 
支持 自由 移动 以 便 正 确 工 作 。 让 我 们 增加 一 个 DPDARulebook 的 辅助 方法 以 处 理 自由 移动 ， 
这 与 NFARulebook 中 的 类 似 (参见 3.2.2 节 ) : 























class DPDARulebook 
def applies to?(configuration, character) 
Irule for(configuration, character).nil? 
end 


def follow free moves(configuration) 
if applies to?(configuration, nil) 
follow free moves(next configuration(configuration, nil)) 
else 
configuration 
end 
end 
end 


DPDARulebook#follow_free_moves 将 不 断 地 反复 执行 能 应 用 到 当前 配置 的 任何 自由 移动 ， 
直到 没有 自由 移动 的 时 候 才 会 停止 : 





>> configuration = PDAConfiguration.new(2, Stack.new(['$'])) 
=> #<struct PDAConfiguration state=2, stack=#<Stack ($)>> 

>> rulebook.follow free moves(configuration) 

=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 














在 我 们 的 状态 机 实验 中 ， 这 是 首次 在 模拟 中 引入 了 有 可 能 的 无 限 循环 。 只 
一 EE》 有 个 自由 移动 链 ， 且 它 的 开始 和 结束 状态 相同 ， 就 会 有 循环 。 最 简单 的 例 
子 是 存在 一 个 根本 不 改变 配置 的 自由 移动 ， 

>> DPDARulebook.new([PDARule.new(1, nil, 1, '$', ['$'])]). 


follow free moves(PDAConfiguration.new(1, Stack.new(['$']))) 
SystemstackError: stack level too deep 


这 些 无 限 循环 毫 无 用 处 ， 因 此 我 们 在 设计 下 推 自 动机 的 时 候 要 注意 避免 它们 。 










































































我 们 还 需要 封装 DPDA#current_configuration 的 默认 实现 ， 以 便利 用 规则 手册 对 自由 移动 
的 支持 : 
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cl. 


en 


现在 我 


如 果 把 


cl 


en 


不 出 所 


ass DPDA 
def current configuration 
rulebook.follow free moves(super) 


end 
d 
们 有 了 可 以 启动 、 接 受 字符 输入 并 且 检 查 是 否 接受 输入 的 DPDA 模拟 了 : 


dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
#<struct DPDA ...> 

dpda.read string('(()('); dpda.accepting? 

false 

dpda.current_ configuration 

#<struct PDAConfiguration state=2, stack=#<Stack (b)b$>> 

dpda.read string('))()'); dpda.accepting? 

true 

dpda.current_ configuration 

#<struct PDAConfiguration state=1, stack=#<Stack ($)>> 


此 模拟 像 往常 一 样 封 装 进 DPDADesign， 我 们 就 可 以 很 容易 地 根据 需要 检查 字符 串 : 


ass DPDADesign < Struct.new(:start state, :bottom character, 
:accept states, :rulebook) 
def accepts?(string) 
to dpda.tap { |dpda| dpda.read string(string) }.accepting? 
end 


def to dpda 
start stack = Stack.new([bottom character]) 
start configuration = PDAConfiguration.new(start state, start stack) 
DPDA.new(start configuration, accept states, rulebook) 


end 
d 
料 ， 我 们 的 DPDA 可 以 识别 任意 山 套 深度 的 平衡 括号 组 成 的 复杂 字符 操 : 


dpda_design = DPDADesign.new(1, '$', [1], rulebook) 
#<struct DPDADesign ...> 





>> 人 
=> true 
>> dpda_design.accepts?("()(())((())))O)))') 
=> true 
>> dpda_design.accepts?("(()(()(()()()O))) ON)') 
=> false 
还 有 最 后 一 个 细节 要 广 意 。 输 入 后 DPDA 处 于 有 效 状 态 时 ， 我 们 的 模拟 运行 得 很 完美 ， 但 


在 机 器 








# 卡 住 的 时 候 它 就 会 出 问题 了 : 





>> dpda design.accepts?('())') 
NoMethodError: undefined method “follow' for nil:NilClass 


之 所 以 


会 发 生 这 种 情况 ， 是 因为 DPDARulebook#next_configuration 假设 它 总 能 找到 可 用 的 





规则 ， 因 此 在 没有 规则 可 用 的 时 候 我 们 不 应 该 调用 它 。 修 改 DPDA#read_character 检查 可 
用 规则 ， 如 果 没 有 可 用 规则 ， 就 把 DPDA 置 于 一 个 无 法 转移 出 去 的 阻塞 状态 ， 这 样 我 们 就 
解决 了 这 个 问题 : 








class PDAConfiguration 
STUCK_STATE = Object.new 


def stuck 
PDAConfiguration.new(STUCK_STATE, stack) 
end 


def stuck? 
state == STUCK_STATE 
end 
end 


class DPDA 
def next configuration(character) 
if rulebook.applies to?(current configuration, character) 
rulebook.next_ configuration(current configuration, character) 
else 
current_ configuration. stuck 
end 
end 


def stuck? 
current configuration.stuck? 
end 


def read character(character) 
self.current configuration = (next configuration(character)) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) unless stuck? 
end 
end 
end 


现在 DPDA 会 优雅 地 阻塞 住 而 不 会 月 江 了 了: 





>> dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
=> #<struct DPDA ...> 

>> dpda.read string('())'); dpda.current_configuration 

=> #<struct PDAConfiguration state=#<0bject>, stack=#<Stack ($)>> 

>> dpda.accepting? 

=> false 

>> dpda.stuck? 

=> true 

>> dpda design.accepts?('())') 

=> false 
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4.2 非 确定 性 下 推 目 动机 


尽管 处 理 平衡 括号 问题 的 机 器 六 融雪 使 米 完 成 工作 ， 但 它 其 实 只 是 将 栈 作为 一 个 计数 
器 ， 并 且 它 的 规则 只 区 分 “ 栈 为 空 ”和 “ 栈 不 为 空 "。 更 复杂 的 DPDA 将 会 把 一 种 以 上 的 

符号 推 人 栈 中 ， 并 在 执行 计算 时 使 用 这 些 信息 。 一 个 简单 的 例子 是 一 台 机 器 ， 它 能 识别 包 
Pe eee rt 











a;a/aa 

b;b/bb 
a;b/ 
b;a/ 


a;$/as$ 
- bj;$/b$ 


我 们 的 模拟 表明 它 能 完成 工作 : 


>> rulebook = DPDARulebook. new([ 


PDARule.new(1, 'a'’, 2, '$', ['a'’, '$']), 
PDARule.new(1, 'b', 2, '$', ['b', '$']), 
PDARule.new(2, 'a'’, 2, 'a', ['a'’, 'a']), 
PDARule.new(2, 'b', 2, 'b', ['b', 'b']), 
PDARule.new(2, 'a', 2, 'b', []), 
PDARule.new(2, 'b', 2, 'a', []), 


PDARule.new(2, nil, 1, '$', ['$']) 
]) 
=> #<struct DPDARulebook rules=[...]> 
>> dpda_design = DPDADesign.new(1, '$', [1], rulebook) 
=> #<struct DPDADesign ...> 
>> dpda_design.accepts?('ababab') 
=> true 
>> dpda_design.accepts?('bbbaaaab') 
=> true 
>> dpda_design.accepts?('baa') 
=> false 


这 与 平衡 括号 的 机 器 类 似 ， 只 是 它 的 行为 由 栈 顶 字符 控制 。a 在 栈 顶 意味 着 机 器 已 经 看 到 
a 过 剩 了 ， 因 此 任何 额外 从 输入 读 取 的 a 将 会 在 栈 中 累积 ， 而 每 读 到 一 个 b 就 会 从 栈 中 弹 
出 一 个 a 作为 抵 销 ;， 反之 ， 栈 顶 是 bp 时， 就 是 p 在 累积 而 用 a 来 抵 销 。 


即使 是 这 个 DPDA 也 没有 利用 栈 的 全 部 优点 。 在 栈 顶 字符 之 下 没有 它 感 兴趣 的 任何 历史 
数据 ， 只 有 一 些 无 意义 的 a 或 b， 因 此 我 们 可 以 只 把 一 种 字符 推 人 栈 〈 也 就 是 说 还 是 把 它 
当 作 一 个 简单 的 计数 器 ) ， 并 使 用 两 个 不 同 的 状态 区 分 “对 过 剩 的 a 计数 ”和 “对 过 剩 的 b 
计数 ”"， 这 样 也 能 得 到 同样 的 结果 : 





























本 EXGE 
b;c/ 








为 了 真正 开发 出 栈 的 潜能 ， 我 们 需要 一 个 更 难 的 问题 强迫 我 们 存储 结构 化 信息 。 经 典 的 例 
子 是 识别 回 文字 符 串 : 随 着 一 个 字符 一 个 字符 地 读 取 输 入 字符 串 ， 我 们 需要 记 住所 看 到 的 
数据 ;一 且 字 符 串 读 取 过 了 一 半 ， 就 要 检查 内 存 以 确定 之 前 看 到 的 字符 是 否 为 当前 呈现 字 
符 的 逆序 。 下 面 这 个 DPDA 能 够 识别 一 个 回 文字 符 串 ， 这 个 字符 串 由 字符 a 和 b 组 成 ， 并 
且 在 中 间 的 位 置 有 一 个 字符 m (表示 中 间 位 置 ) : 








aj$/ag 
a;a/aa 
a;b/ab 
b;$/b$ 
b;a/ba a;a/ 
b;b/bb m;$/$  b;b/ 


m;a/a 
m;b/b 局 $/$ G) 


这 台 机 器 从 状态 1 开始 ， 不 断 从 输入 读 取 a 和 b， 然 后 把 它们 推 入 栈 中 。 它 读 到 nm 的 时 候 ， 
会 转移 到 状态 2， 在 那里 一 直 读 取 输 入 字符 同时 尝试 把 每 一 个 字符 都 弹出 栈 。 如 果 字 符 串 后 
半 部 分 的 每 一 个 字符 都 与 栈 中 弹出 的 内 容 匹 配 ， 机 器 就 停留 在 状态 2 并 最 终 磁 到 栈 底 的 $， 
此 时 转移 到 状态 3 并 接受 这 个 输入 字符 串 。 处 于 状态 2 的 时 候 ， 如 果 读 入 的 任何 字符 与 栈 
顶 的 字符 不 匹配 ， 那 就 没有 规则 可 以 遵守 ， 因 此 它 将 进入 阻塞 状态 并 拒绝 这 个 字符 串 。 





我 们 可 以 模拟 这 台 DPDA 检查 它 的 工作 情况 : 


>> rulebook = DPDARulebook.new([ 
PDARule.new(1, 'a'’, 1, '$', ['a'’, '$']), 
PDARule.new(1, 'a', 1, 'a', ['a'’, 'a']), 
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PDARule.new(1, 'a', 1, 
PDARule.new(1, 'b', 1, 
PDARule.new(1, 'b', 1, 
PDARule.new(1, 'b', 1, 
PDARule.new(1, 'm', 2, 
PDARule.new(1, 'm', 2, 
PDARule.new(1, 'm', 2, 
PDARule.new(2, 'a', 2, 
PDARule.new(2, 'b', 2, 
PDARule.new(2, nil, 3, 
]) 

=> #<struct DPDARulebook rules=[...]> 

>> dpda_design = DPDADesign.new(1, '$', [3], rulebook) 

=> #<struct DPDADesign ...> 

>> dpda_design.accepts?('abmba') 

=> true 

>> dpda_design.accepts?('babbamabbab') 

=> true 

>> dpda_design.accepts?('abmb') 

=> false 

>> dpda_design.accepts?('baambaa') 

=> false 


Wo an 避 


SS 


> vv vv -vv vv 
- 


= 


A ~— TV HTTTY 


了 可 山林 
[um 
\ 一 


这 很 好 ， 但 是 输入 字符 串 中 间 的 m 是 一 种 逃避 。 我 们 为 什么 不 能 设计 一 台 机 器 ， 让 它 能 识 
别 回 文字 符 串 一 一 aa、abba、babbaabbab 等 一 一 但 无 需 在 中 间 插 入 一 个 标记 呢 ? 











机 器 在 到 达 字 符 串 的 中 间 位 置 时 需要 从 状态 1 转移 到 状态 2， 而 没有 标记 的 话 ， 就 没 法 知道 
什么 时 候 做 这 样 的 状态 转移 。 就 像 我 们 之 前 处 理 NFA 时 看 到 的 那样 ， 这 种 “我 怎么 知道 什 
么 时 候 该 ……” 的 问题 可 以 通过 放松 确定 性 约束 并 人 允许 机 器 在 任意 时 间 都 可 以 做 重要 的 状 
态 转 移 来 解决 ， 这 样 它 就 可 能 通过 在 正确 的 时 间 遵照 正确 的 规则 接受 一 个 回 文字 符 串 。 


不 出 所 料 的 是 ， 没 有 确定 性 约束 的 下 推 自动 机 叫 作 非 确定 性 下 推 自动 机 (nondeterministic 
pushdown automaton) 。 下 面 是 一 台 能 识别 由 偶数 个 字母 组 成 的 回 文字 符 串 的 非 确 定性 下 推 
自动 机 “: 








a;$/as$ 
a;a/aa 
a;b/ab 
b;$/b$ 
b;a/ba a;a/ 
b;b/bb $/$  b;b/ 


a/a 
人 bb hi _ 和 ;G) 


注 6:“ 偶 数 个 字母 ”的 约束 能 让 机 器 保持 简单 : 一 个 长 度 是 2n 的 回 文字 符 串 可 以 通过 先 把 n 个 字符 推 入 栈 
然后 再 把 n 个 字符 弹出 栈 来 接受 。 为 了 识别 任意 的 回 文字 符 串 ,需要 从 状态 1 到 状态 2 之 间 多 一 些 规则 。 















































除了 状态 1 到 状态 2 的 规则 ， 这 和 DPDA 的 版 本 是 一 样 的 : 在 DPDA 中 ， 它 们 从 输入 读 
取 m， 但 这 里 是 自由 移动 。 这 让 NPDA 有 机 会 在 输入 字符 串 的 时 候 改 变 状态 ， 而 不 再 需要 


























标记 了 。 
4.2.1 模拟 
一 台 非 确定 性 机 器 要 比 一 台 确 定性 机 器 更 难 模拟 ， 但 我 们 在 3.2.1 节 中 已 经 完成 了 NFA 中 
因此 可 以 在 处 理 NPDA 时 重用 同样 的 思想 。 我 们 需要 一 个 NPDARulebook 来 保 
它 的 实现 也 几乎 和 NFARulebook 完全 一 样 : 





困难 的 部 分 ， 
存 一 个 PDARule 的 非 确定 性 集合 ， 





require "set 


class NPDARulebook < Struct.new(:rules) 
def next_configurations(configurations, character) 
configurations.flat map { |config| follow rules for(config, character) }.to_ set 


end 
def follow rules for(configuration, character) 
rules for(configuration, character).map { |rule| rule.follow(configuration) } 


end 
def rules for(configuration, character) 
rules.select { |rule| rule.applies to?(configuration, character) } 
end 
end 
在 3.2.1 市 中 ,我们 通过 跟踪 可 能 状态 的 集合 来 模拟 一 台 NFA， 这 里 会 通过 可 能 配置 的 集 





合 来 模拟 一 台 NPDA。 
自由 移动 ， 这 又 一 次 几乎 与 NFARulebook 的 实现 一 致 ; 


我 们 的 规则 手册 需要 支持 
next_configurations(configurations, nil) 


class NPDARulebook 
def follow free moves(configurations) 





more_configurations 
if more_ configurations.subset?(configurations) 
configurations 


else 
follow free moves(configurations + more configurations) 


end 
end 


end 
在 当前 配置 的 集合 之 外 ， 我 们 还 需要 一 个 NPDA 类 来 封装 一 个 规则 手册 : 


class NPDA < Struct.new(:current configurations, :accept states, :rulebook) 





def accepting? 
current configurations.any? { |config| accept states.include?(config.state) } 


end 
| 113 


def read character(character) 
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self.current configurations = 
rulebook.next_ configurations(current configurations, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 


def current configurations 
rulebook.follow free moves(super) 

end 

d 


这 让 我 们 可 以 随 着 每 个 字符 的 读 入 单 步 模拟 出 所 有 可 能 的 配置 ; 


>> 





rulebook = NPDARulebook.new([ 

PDARule.new(1, 'a'’, 1, '$', ['a’, '$']), 
PDARule.new(1, 'a', 1, 'a', ['a', 'a']), 
PDARule.new(1, 'a'’, 1, 'b', ['a'’, 'b']), 
PDARule.new(1, 'b', 1, '$', ['b', '$']), 
PDARule.new(1, 'b', 1, 'a'’, ['b', 'a']), 
PDARule.new(1, 'b', 1, 'b', ['b', 'b']), 
PDARule.new(1, nil, 2, '$', ['$']), 
PDARule.new(1, nil, 2, 'a', ['a']), 
PDARule.new(1, nil, 2, 'b', ['b']), 
PDARule.new(2, 'a', 2, 'a', []), 
PDARule.new(2, 'b', 2, 'b', []), 
PDARule.new(2, nil, 3, '$', ['$']) 


]) 
#<struct NPDARulebook rules=[...]> 


configuration = PDAConfiguration.new(1, Stack.new(['$'])) 

#<struct PDAConfiguration state=1, stack=#<Stack ($)>> 

npda = NPDA.new(Set[configuration], [3], rulebook) 

#<struct NPDA ...> 

npda.accepting? 

true 

npda.current configurations 

#<Set: { 
#<struct PDAConfiguration state=1, stack=#<Stack ($)>>, 
#<struct PDAConfiguration state=2, stack=#<Stack ($)>>, 
#<struct PDAConfiguration state=3, stack=#<Stack ($)>> 

}> 

npda.read string('abb'); npda.accepting? 

false 

npda.current_ configurations 

#<Set: { 
#<struct PDAConfiguration state=1, stack=#<Stack (b)ba$>>， 
#<struct PDAConfiguration state=2, stack=#<Stack (a)$>>, 
#<struct PDAConfiguration state=2, stack=#<Stack (b)ba$>> 

和 

npda.read character('a'); npda.accepting? 

true 





>> npda.current configurations 
=> #<Set: { 
#<struct PDAConfiguration state=1, stack=#<Stack (a)bba$>>, 
#<struct PDAConfiguration state=2, stack=#<Stack ($)>>, 
#<struct PDAConfiguration state=2, stack=#<Stack (a)bba$>>, 
#<struct PDAConfiguration state=3, stack=#<Stack ($)>> 
}> 


最 后 用 一 个 NPDADesign 类 直接 测试 字符 串 : 


class NPDADesign < Struct.new(:start state, :bottom character, 
:accept_ states, :rulebook) 
def accepts?(string) 
to npda.tap { |npda| npda.read string(string) }.accepting? 
end 


def to npda 
start stack = Stack.new([bottom character]) 
start configuration = PDAConfiguration.new(start state, start stack) 
NPDA.new(Set[start configuration], accept states, rulebook) 
end 
end 


现在 可 以 检查 一 下 NPDA 是 否 确实 可 以 识别 回 文 字符 串 ; 


>> npda_design = NPDADesign.new(1, '$', [3], rulebook) 
=> #<struct NPDADesign ...> 

>> npda_design.accepts?('abba') 

=> true 

>> npda_design.accepts?('babbaabbab') 

=> true 

>> npda_design.accepts?('abb') 

=> false 

>> npda_design.accepts?('baabaa') 

=> false 


看 起 来 很 好 啊 ! 非 确定 性 明显 已 经 给 了 我 们 确定 性 机 器 所 不 具备 的 识别 语言 的 能 力 。 


4.2.2 不 等 价 


但 是 等 一 等 : 我 们 在 3.4 节 中 看 到 ， 没 有 栈 的 非 确定 性 机 器 在 能 力 上 与 确定 性 机 器 是 等 价 
的 。 我 们 用 Ruby 模拟 的 NFA 行为 像 是 一 台 DFA (它们 都 是 随 着 从 输入 读 取 字 符 在 有 限 
个 “模拟 状态 ”中 转移 ) ， 可 以 把 任意 一 台 NFA 转换 成 接受 同样 字符 的 DFA。 那 么 非 确 定 
性 真 的 能 带 给 我 们 额外 的 能 力 ， 还 是 Ruby 模拟 的 NPDA 只 是 行为 类 似 DPDA 呢 ? 是 否 存 
在 一 个 算法 能 把 任意 的 非 确定 性 下 推 自动 机 转换 成 确定 性 下 推 自 动机 呢 ? 





























答案 是 不 存在 。NFA 到 DFA 的 小 把 戏 能 成 功 ， 是 因为 我 们 可 以 使 用 一 个 DFA 状态 表示 
多 个 可 能 的 NFA 状态 。 为 了 模拟 一 台 NFA， 我 们 只 需要 跟踪 现在 它 可 能 处 于 的 状态 ， 然 
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后 每 次 读 取 一 个 输入 字符 就 选 一 个 不 同 的 可 能 状态 集合 ， 这 样 如 果 给 它 设 定 正确 的 规则 ， 
DFA 就 可 以 轻松 完成 工作 。 


但 这 个 小 把 戏 不 适用 于 PDA: 我 们 不 能 有 效 地 把 多 重 NPDA 配置 表示 成 一 个 DPDA 配置 。 
并 不 奇怪 ， 问 题 出 在 栈 的 上 面 。 一 个 NPDA 模拟 需要 知道 当前 能 出 现在 栈 顶 的 所 有 字符 ， 
而 且 它 必须 能 同时 从 几 个 模拟 的 栈 弹 出 和 推 入。 无 法 把 所 有 可 能 的 栈 组 合成 一 个 栈 ， 以 便 
DPDA 仍 能 看 到 所 有 的 栈 顶 字符 并 可 以 单独 访问 每 个 可 能 的 栈 。 我 们 用 Ruby 写 一 个 程序 
做 所 有 这 些 并 不 难 ， 但 是 DPDA 没有 足够 的 能 力 来 处 理 。 








所 以 不 幸 的 是 ， 我 们 的 NPDA 模拟 的 行为 并 不 像 一 台 DPDA， 也 不 存在 NDPA 到 DPDA 
的 算法 。 无 标记 的 回 文 问题 就 是 这 样 一 个 例子 ，NPDA 能 完成 这 个 问题 ,但 DPDA 不 能 ， 
因此 非 确定 性 下 推 自动 机 确实 比 确定 性 的 能 力 要 强 。 


4.3 ”使 用 下 推 自 动机 进行 分 析 


3.3 节 展 示 了 如 何 用 非 确 定性 有 限 自 动机 实现 正则 表达 式 匹 配 。 下 推 自 动机 也 有 一 个 重要 
的 实际 应 用 : 它们 能 用 来 解析 编程 语言 。 





在 2.6 节 中 ， 我 们 已 经 看 到 如 何 使 用 Treetop 为 一 部 分 Simple 语言 构建 解析 器 。Treetop 解 
析 器 使 用 解析 表达 式 语法 来 描述 被 解析 语言 的 完整 语法 ， 但 这 是 一 个 相当 现代 的 思想 。 更 
传统 的 方式 是 把 解析 过 程 分 成 两 个 独立 的 阶段 。 


。 词法 分 析 
读 取 一 个 原始 字符 串 然后 把 它 转 换 成 一 个 单词 oken 序列 。 每 一 个 单词 token 代表 程序 
语法 的 一 个 组 成 部 分 ， 例 如 “变量 名 "、“ 左 括号 ”或 者 “while 关键 字 "。 词 法 分 析 器 使 
用 称 为 词法 的 规则 集合 来 决定 什么 样 的 字符 应 该 产生 什么 样 的 单词 。 这 个 阶段 处 理 杂乱 
的 字 答 级别 的 细节 ， 比 如 变量 命名 规则 、 注 释 和 空格 ， 它 为 下 一 阶段 的 处 理 准备 好 清楚 
的 单词 序列 。 




















人: 























。 语法 分 析 
读 入 一 个 单词 序列 并 根据 正在 分 析 的 语言 语法 判断 它们 是 否 代表 一 个 有 效 的 程序 。 如 果 
程序 有 效 ， 那 么 语法 解析 器 会 生成 一 些 关于 程序 结构 的 附加 信息 〈 如 一 个 解析 树 ) 。 





4.3.1 词法 分 析 

词法 分 析 阶 段 通 常 相当 直接 。 这 可 以 通过 正则 表达 式 实现 (因而 也 就 是 通过 一 台 NFA 实 
现 )， 因 为 它 把 字符 序列 与 一 些 规则 简单 匹配 以 判断 那些 字符 是 否 为 关键 字 、 变 量 名 、 运 
算 符 或 者 其 他 什么 符号 。 下 面 是 一 些 快速 但 是 不 整洁 的 Ruby 代码 ， 可 以 把 一 个 Simple 程 
序 断 成 单词 : 




















class LexicalAnalyzer < Struct.new(:string) 


GRAMMAR = [ 
{ token: 'i', pattern: /if/ }，# if 关键 字 
{ token: 'e', pattern: /else/ }，## else 关键 字 
{ token: 'w', pattern: /while/ }，# while 关键 字 
{ token: 'd', pattern: /do-nothing/ }, # do-nothing 关键 字 
{ token: '(', pattern: /\(/ }，# 左 小 括号 
{ token: ')', pattern: /\)/ }，# 右 小 括号 
{ token: '{', pattern: /\{/ }，## 左 大 括号 
{ token: '}', pattern: /\}/ }，# 右 大 括号 
{ token: ';', pattern: /;/ }，## 分 号 
{ token: '=', pattern: /=/ }， 闻 等 号 
{ token: '+', pattern: /\+/ }，## 加 号 
{ token: '*', pattern: /\*/ }，# 乘 号 
{ token: '<', pattern: /</ }， 多 小 于 号 
{ token: 'n', pattern: /[0-9]+/ }，# 数字 
{ token: 'b',，pattern: /true|false/ }, # 布尔 值 
{ token: 'v', pattern: /[a-z]+/ } 多 变量 名 


] 


def analyze 
[].tap do |tokens| 
while more tokens? 
tokens.push(next_ token) 
end 
end 
end 


def more tokens? 
!string.empty? 
end 


def next token 
rule, match = rule matching(string) 
self.string = string after(match) 
Tule[ :token] 

end 


def rule matching(string) 
matches = GRAMMAR.map { |rule| match at beginning(rule[:pattern], string) } 
rules with matches = GRAMMAR.zip(matches).reject { |rule, match| match.nil? } 
rule with longest match(rules with matches) 

end 


def match at beginning(pattern, string) 
/\A#{pattern}/.match(string) 
end 


def rule with longest match(rules with matches) 
rules with matches.max by { |rule, match| match.to s.length } 
end 


def string after(match) 
match.post match.lstrip 
end 
end 
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几 从 
这 个 实现 使 用 单个 字符 作为 单词 一 的 意思 是 “while 关键 字 ”，+ 的 意思 
人 心 4 、 是 “加 号 ”， 以 此 类 推 一 因为 我 们 准备 把 这 些 单词 提供 给 PDA， 而 我 们 


DS 


~ Ruby 模拟 的 PDA 期 望 以 字符 作为 输入 。 














单字 符 的 单词 足以 应 付 基本 的 演示 需要 了 ， 这 里 我 们 不 需要 保留 变量 名 或 者 
字面 值 。 但 是 在 真正 的 解析 器 里 ， 我 们 就 需要 合适 的 数据 结构 表示 单词 ， 这 
样 它们 才能 在 传达 “ 某 个 不 知名 的 变量 ”或 “ 某 个 未 知 的 布尔 值 ”之 外 包 
更 多 的 信息 。 











通过 使 用 Simple 代码 组 成 的 字符 串 创 建 LexicalAnalyzer 实例 ， 然 后 调用 它 的 要 nalyze 方 
法 ， 我 们 可 以 获得 一 个 由 单词 组 成 的 数组 ， 这 个 数组 说 明了 如 何 把 代码 断 成 关键 字 、 运 算 
符 、 标 点 以 及 其 他 语法 : 


>> LexicalAnalyzer. new(' y = x * 7').analyze 


= L” V ,nN '"] 

>> LexicalAnalyzer. new(， while (x < 5) { x=x*3}' 小 analyze ， 

= 区 w" 3 区 'v" 和 2 3 "n" 时 ")n 和 "{" 3 "v" 3 "=", 'v" 入 Te 'n" P| 

>> LexicalAnalyzer. new(， if (x < 10) {y= true; x = 0 } else { do-nothing }').analyze 
a 人 








词法 分 析 要 按照 最 长 匹配 选择 规则 进行 ， 否 则 会 造成 变量 名 被 错误 地 识别 为 
心 关键 字 : 


ne 











>> LexicalAnalyzer. new('x = false').analyze 

=> ["Vv", "=", "b"] 

>> LexicalAnalyzer.new('x = falsehood').analyze 

= CV; "= ， "v"] 
解决 这 个 问题 还 有 其 他 的 方法 。 一 种 就 是 在 规则 中 使 用 限制 性 更 强 的 正则 表 
达 式 : 如 果 布 尔 值 的 规则 使 用 模式 /(true|false)(?![a-z])/， 那 它 就 不 会 首 
先 匹 配 字符 串 "falsehood 了 。 








4.3.2 ”语法 分 析 


把 字符 串 转 成 单词 之 后 ， 难 一 些 的 问题 就 是 确定 这 些 单词 是 否 表示 一 个 语法 有 效 的 Simple 
程序 了 。 我 们 不 铺 使 用 正 则 表达 式 或 者 NFA 一 一 Simple 的 语法 人 允许 任意 的 括号 能 套 ， 而 我 
们 已 经 知道 有 限 自 动机 的 能 力 不 足 以 识别 这 样 的 语言 。 但 是 使 用 下 推 自 动机 是 可 以 识别 单 
词 的 有 效 序列 的 ， 所 以 下 面 来 看 看 如 何 构造 一 台 下 推 自动 机 。 








首先 ， 我 们 需要 一 个 语法 描述 单词 如 何 组 合 形成 程序 。 下 面 是 基于 2.6 节 中 Treetop 语法 结 
构 的 一 部 分 Simple 语法 : 


< 语句 > ::= <while> | < 赋值 > 





<whiley := "Ww''(' < 表达 式 >》')''{' < 语句 > '}》 
< 赋值 > := VvV' '=' < 表达 式 > 

< 表达 式 > :=《 小 于 表达 式 . > 

< 小 于 表达 式 、》::= 《< 乘 >'<' 《小 于 表达 式 > |《 乘 > 

< 乘 > :=《 名 词 y》'*'《 乘 》|《 名 词 > 

< 名 词 > ss i | 


这 叫 作 上 下 文 无 关 文 法 (Context-Free Grammar，CFG)。 "每 一 条 规则 的 左边 是 一 个 符号 ， 
右边 是 一 个 或 多 个 符号 序列 和 单词 。 例 如 ， 规 则 < 语句 > ::= <while> | 《赋值 > 的 意思 是 
一 个 Simple 语句 要 么 是 while 人 循环 要 么 是 一 个 赋值 ， 而 < 赋值 >::=“'v”'=' < 表达 式 > 的 
意思 是 一 个 赋值 语句 由 一 个 变量 名 后 面 跟 上 一 个 等 号 和 一 个 表达 式 组 成 。 


CFG 是 一 个 Simple 结构 的 静态 描述 ， 但 我 们 把 它 看 成 一 个 生成 Simple 程序 的 规则 集合 。 
从 “< 语句 >” 开始 ， 我 们 应 用 文法 规则 递归 展开 符号 直到 只 剩 下 单词 为 止 。 下 面 是 根据 规 
则 完全 展开 “< 语句 >” 的 方式 之 一 : 














“语句 > 一 《赋值 > 





一 v “= 《表达 式 > 
一 v “= 《小 于 表达 式 > 
一 v "= 《 乘 > 
一 v = 《名 词 >'*' 《 乘 > 
一 vv = 'V' '*' 《< 乘 > 
一 'V = 'V，'*' < 名词 > 
一 Vs V *" Nn 
这 表明 v = vv om 在 语法 上 有 效 ， 但 我 们 要 的 是 相反 方向 的 能 力 : 能 识别 有 效 


的 程序 ， 而 不 是 生成 它们 。 在 由 词法 分 析 得 到 一 串 单词 的 时 候 ， 我 们 想 要 知道 是 否 可 以 按 
照 某 种 顺序 应 用 文法 规则 把 “< 语句 >” 扩展 成 这 些 单词 。 幸 好 ， 有 办 法 把 上 下 文 无 关 文法 
转换 成 能 做 出 这 种 判断 的 非 确定 性 下 推 自 动机 。 


把 一 个 CFG 转换 成 PDA 的 方法 如 下 。 


(1) 选取 一 个 字符 表示 文法 中 的 每 个 符号 。 在 这 种 情况 下 ， 我 们 使 用 每 个 符号 的 大 写 首 字 
母 一 5 表示 “< 语句 >”，W 表示 <whiley， 以 此 类 推 -这 是 为 了 与 我 们 已 经 用 来 作为 
单词 的 小 写字 符 区 分 开 。 

(2) 使 用 PDA 的 栈 存储 表示 文法 符号 的 字符 (5、W、A、E……) 和 单词 (wv、=、*、 
i ) 。PDA 启动 的 时 候 ， 立 即 把 一 个 符号 推 人 栈 中 ， 这 个 符号 表示 它 正在 试图 识别 的 
结构 。 我 们 想 要 识别 Simple 语句 ， 所 以 PDA 开始 时 要 把 5 推 入 栈 中 





>> start rule = PDARule.new(1, nil, 2, '$', ['S', '$']) 
=> #<struct PDARule ...> 








注 7: 文法 是 “上 下 文 无 关 的 ” 指 它 的 规则 没有 提 到 文法 可 能 出 现 的 上 下 文 ， 一 个 赋值 语句 不 管 周围 是 什么 
单词 ， 它 总 是 包含 一 个 变量 名 、 赋 值 符号 和 表达 式 。 不 是 所 有 的 语言 都 可 以 用 这 种 文法 描述 ， 但 几乎 
所 有 的 编程 语言 都 可 以 。 
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(3) 把 文法 规则 转换 成 无 需 任何 输入 就 能 扩展 栈 顶 符号 的 PDA 规则 。 








一 个 文法 规则 描述 


ee A 让 各 让 大 相 区 拓 














成 一 个 PDA 规则 ， 它 把 一 个 代表 特定 符号 的 字符 弹出 栈 并 把 其 他 字符 推 入 栈 中 : 








>> Symbol rules = [ 
# «statement> ::= <¢while> | «assign> 
PDARule.new(2, nil, 2, 'S', ['W']), 
PDARule.new(2, nil, 2, 'S', ['A']), 


# ewhile> ::= 'w' '(' ¢expression> ')' '{' «statement> '}" 


PDARule.new(2, nil, 2, 'W', ['w', '(', 'E’, ')', '{', 'S', '}']), 


# ¢assign> ::= 'V'" '=" ¢eXxpression> 
PDARule.new(2, nil, 2, 'A', ['v', '=', 'E']), 


# <expression> ::= ¢less-than> 
PDARule.new(2, nil, 2, 'E'’, ['L']), 


# ¢less-than> ::= multiply> '¢" ¢less-than> | <multiply> 
PDARule.new(2, nil, 2, 'L', ['M', '<', 'L']), 
PDARule.new(2, nil, 2, 'L', ['M']), 


# multiply> ::= <¢term> '*" cmultiply> | <term> 
PDARule.new(2, nil, 2, 'M'’, ['T', '*', 'M']), 
PDARule.new(2, nil, 2, 'M', ['T']), 


# <¢term> 1:= nf 'v' 
PDARule.new(2, nil, 2, 'T', ['n']), 
PDARule.new(2, nil, 2, 'T', ['v']) 


] 
=> [#<struct PDARule ...>, #<struct PDARule ...>, ...] 





例如 ， 赋 值 语 名 的 规则 说 的 是 “赋值 >” 符号 可 以 扩展 成 单词 v、 





= 以 及 后 面 的 “ 表 





达 式 >” eR 它 可 以 自发 地 从 栈 中 弹出 A 并 推 入 字符 
v=E。“ 语 句 >” 规则 说 的 是 我 们 可 以 把 “< 语句 >” 符 号 用 一 个 <while> 或 者 “赋值 > 替 
换 ， 我 们 已 经 把 它 转换 成 了 一 个 PDA 规则 ， 它 把 一 个 5 从 栈 中 弹出 ， 然 后 用 一 个 W 替 


换 ， 而 另 一 条 规则 是 把 S 从 弹出 然后 推 入 A。 


(4) 为 每 一 个 单词 符号 赋予 一 个 PDA 规则 ， 这 个 规则 从 输入 读 取 字 符 然后 把 它 从 栈 中 弹出 : 


>> token rules = LexicalAnalyzer::GRAMMAR.map do |rule| 
PDARule.new(2, rule[:token], 2, rule[:token], []) 

end 
=> [#<struct PDARule ...>, #<struct PDARule ...>, ...] 


这 些 单词 规则 与 符号 规则 的 工作 方式 相反 。 符 号 规则 试图 让 栈 变 大 ， 有 了 时候 会 推 入 一 些 
字符 以 替换 已 经 弹出 的 ， 单 词 规则 总 是 让 栈 更 小 ， 随 着 栈 的 变 小 处 理 输入 。 


(5) 最 后 ， 生 成 一 个 PDA 规则 ， 在 栈 变 成 空 时 它 允 许 机 器 进入 接收 状态 : 





>> stop rule = PDARule.new(2, nil, 3, '$', ['$']) 
=> #<struct PDARule ...> 








现在 我 们 可 以 使 用 这 些 规则 构建 一 台 PDPA， 输 入 一 个 由 单词 组 成 的 字符 串 看 它 是 否 能 够 识 
别 。 由 Simple 语法 生成 的 规则 是 非 确定 性 的 (每 当 字符 5s、L、M 或 者 T 处 于 栈 顶 的 时 候 
就 会 有 多 个 可 用 的 规则 )， 因 此 它 只 能 是 一 台 NPDA。 














>> rulebook = NPDARulebook.new([start rule, stop rule] + symbol rules + token rules) 
=> #<struct NPDARulebook rules=[...]> 

>> npda_design = NPDADesign.new(1, '$', [3], rulebook) 

=> #<struct NPDADesign ...> 

>> token string = LexicalAnalyzer.new('while (x < 5) { x = x * 3 }').analyze.join 

=> "Ww(v<n){v=v*n}" 

>> npda_design.accepts?(token string) 

=> true 

>> npda_design.accepts?(LexicalAnalyzer.new('while (x < 5 x = x * }').analyze.join) 
=> false 


为 了 准确 地 表示 整个 过 程 ， 下 面 是 向 这 台 NPDA 输入 字符 串 'w(v<n){v=v*n}' 后 的 一 个 可 
能 执行 : 

















状态 是 否 接受 栈 的 内 容 剩余 输入 动作 

1 否 $ w(v<n){v=v*n} 推 人 Ss， 转 移 到 状态 2 
| 否 S$ w(v<n){v=v*n} 弹出 S, 推 信 W 

2 否 ws$ w(v<n){v=v*n} 弹出 W， 推 入 w(E){5} 
2 否 w(E){S}$ w(v<n){v=v*n} 读 取 w， 弹 出 w 

2 En (E){S}$ (v<n){v=v*n} 读 取 (， 弹 出 ( 
2 否 E){S}$ v<n){v=v*n} 弹出 E， 推 人 上 

2 否 L){S}$ v<n){v=v*n} 弹出 L， 推 入 MKL 
2 否 M<L){S}$ v<n){v=v*n} 弹出 M， 推 入 T 

2 否 T<L){S}$ v<n){v=v*n} 弹出 T， 推 入 v 

2 否 v<L){S}$ v<n){v=v*n} 读 取 v， 弹 出 v 

2 否 <L){S}$ <n){v=v*n} 读 取 <， 弹 出 < 

2 否 L){S}$ n){v=v*n} 弹出 L， 推 人 

2 否 M){S}$ n){v=v*n} 弹出 M， 推 人 T 

2 否 T){S}$ n){v=v*n} 弹出 T， 推 人 n 

2 否 n){Sj$ n){v=v*n} 读 取 n, 弹出 n 

2 否 ){5j}$ ){v=v*n} 读 取 )， 弹 出 ) 

2 否 {5}$ {v=v*n} 读 取 {， 弹 出 { 

2 否 5j$ v=v*n} 弹出 5， 推 人 A 

2 否 Aj$ v=v*n} 弹出 A， 推 入 v=E 
2 否 v=E}$ v=v*n} 读 取 v， 弹 出 v 

2 否 =E}$ =v*n} 读 取 =， 弹 出 = 

2 否 Ej$ v*n} 弹出 E， 推 人 上 
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状态 是 否 接受 栈 的 内 容 剩余 输入 动作 

2 否 L}$ v*n} 弹出 L， 推 入 M 
否 M}$ v*n} 弹出 M， 推 入 T*M 
2 否 T*M}$ v*n} 弹出 T， 推 人 V 
2 否 v*M}$ v*n} 读 取 v， 弹 出 v 
2 否 *M}$ en 读 取 *， 弹 出 * 
2 否 M}$ n} 弹出 M， 推 入 T 
2 否 T}$ n} 弹出 T, 推 信 n 
2 否 n}$ n} 读 取 n， 弹出 n 
2 否 }$ } 读 取 }， 弹 出 } 
2 否 $ 转移 到 3 

3 是 $ a 


这 个 执行 过 程 的 跟踪 向 我 们 展示 了 机 器 在 符号 和 单词 规则 之 间 的 摇摆 ， 符 号 规则 不 断 地 扩 
展 栈 顶 符号 ， 直 到 此 符号 被 一 个 单词 取代 ， 然 后 单词 规则 再 对 校 (和 输入 ) 进行 处 理 ， 
直到 遇 到 一 个 符号 为 止 。 只 要 输入 字符 串 能 够 由 文法 规则 生成 ， 这 样 的 反复 就 能 得 到 一 个 
空 栈 。* 

在 每 一 步 执行 中 PDA 是 怎么 知道 选择 哪个 规则 的 呢 ? 这 是 非 确定 性 的 力量 ; 我 们 模拟 
的 NPDA 对 所 有 可 能 的 规则 进行 尝试 ， 因 此 只 要 存在 某 种 方式 能 得 到 空 栈 ， 我 们 就 能 找 
到 它 。 








4.3.3 ”实践 性 

这 个 分 析 的 过 程 依赖 于 非 确 定性 ， 但 在 实际 程序 中 ， 最 好 能 避免 非 确 定性 ， 因 为 一 个 确定 
性 的 PDA 模拟 起 来 要 比 非 确定 性 的 快 得 多 而 且 容 易 得 多 。 幸 运 的 是 ， 在 每 个 阶段 几乎 都 
可 以 使 用 输入 单词 本 身 决 定 该 应 用 哪个 符号 规则 ， 这 样 就 可 能 把 非 确定 性 去 掉 一 一 这 个 技 
术 叫 作 递 推 (lookahead) 一 一 但 这 让 从 CFG 到 PDA 的 转换 更 为 复杂 。 

















只 能 识别 有 效 程序 也 不 够 好 。 就 像 我 们 在 2.6 节 看 到 的 那样 ， 解 析 一 个 程序 的 要 领 就 是 把 
程序 转 成 一 个 能 用 来 做 一 些 有 用 事情 的 结构 化 表示 。 在 实践 中 ， 我 们 可 以 让 PDA 模拟 记 
录 它 到 达 接 受 状态 过 程 中 的 规则 序列 ， 以 此 来 创建 结构 化 表示 ， 这 个 规则 序列 提供 了 构建 
一 个 分 析 树 所 需 的 足够 信息 。 例 如 ， 上 面 的 执行 序列 展示 了 为 了 形成 需要 的 单词 序列 如 何 
展开 栈 顶 的 符号 ， 并且 告 诉 了 我 们 字符 串 'w(v<n){v=v*n}' 的 解析 树 形状 : 























注 8: 这 个 算法 叫 作 LL 分 析 。 第 一 个 工 代 表 “ 从 左 到 右 ”， 因 为 输入 字符 串 是 按 这 个 方向 读 取 的 ;第 二 个 
L 代表 “ 左 侧 优先 推导 ”， 因 为 总 是 栈 中 最 左边 的 (也 就 是 最 上 面 的 ) 符号 得 到 扩展 。 
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在 这 一 章 中 ， 我 们 见 到 了 两 个 新 的 计算 能 力 的 级 别 : DPDA 比 DFA 和 NFA 更 强大 ， 而 
NPDA 要 比 DPDA 更 强大 。 能 访问 栈 之 后 ， 看 起 来 下 推 自动 机 比 有 限 自 动机 要 强大 和 复杂 


一 些 。 











拥有 栈 的 主要 结果 就 是 能 识别 某 些 有 限 自 动机 不 能 识别 的 语言 了 ， 如 回 文 和 平衡 括号 字符 
串 。 栈 提供 的 无 限 存储 使 PDA 能 在 计算 中 记 住 任意 数量 的 信息 并 在 随后 再 次 使 用 它 。 


与 有 限 自 动机 不 同 ，PDA 可 以 在 没有 任何 输入 的 情况 下 无 限 循环 ， 这 虽然 不 是 很 有 用 ， 但 
是 比较 少见 。DFA 只 能 通过 处 理 输入 字符 来 改变 状态 ， 而 NFA 尽管 可 以 自发 地 通过 自由 
移动 改变 状态 ， 但 它 只 能 在 回 到 起 点 之 前 进行 有 限 次 数 的 自由 移动 。 另 一 方面 ，PDA 可 以 
保持 在 一 个 状态 并 不 断 地 把 字符 推 入 栈 中 ， 永 远 也 不 会 重复 同样 的 配置 。 





























在 某 种 程度 上 ， 下 推 自 动机 还 能 控制 自己 。 在 规则 和 栈 之 间 有 一 个 反馈 环 一 一 栈 的 内 容 影 
响 机 器 应 该 遵守 的 规则 ， 而 按照 某 个 规则 执行 也 会 影响 栈 的 内 容 一 一 这 允许 PDA 在 栈 中 











增加 计算 能 | 123 


存储 一 些 信 息 ， 这 些 信息 可 以 影响 它 将 来 的 执行 。 有 限 自动 机 依赖 于 类 似 的 规则 和 当前 状 
态 之 间 的 反馈 ,但 这 个 反馈 作用 要 小 一 些 ， 因 为 当前 状态 在 改变 之 后 就 完全 被 遗忘 了 ， 而 
把 字符 推 入 栈 中 可 以 把 老 的 内 容 保 存 起 来 供 以 后 使 用 。 


因此 PDA 确实 是 要 强大 一 些 ， 但 它 的 限制 是 什么 呢 ? 即使 我 们 只 对 看 到 的 模式 匹配 应 用 
感 兴趣 ， 下 推 自动 机 仍然 严重 受 限 于 栈 的 工作 方式 。 在 栈 顶 字符 之 下 的 内 容 没 有 办 法 随 
机 访问 ， 因 此 如 果 机 器 想 要 读 取 埋 在 栈 中 间 的 一 个 字符 ， 就 得 弹出 这 个 字符 上 面 所 有 的 
东西 。 一 旦 字符 被 弹出 ， 就 永远 消失 了 。 我 们 设计 了 一 台 PDA 以 识别 由 等 量 的 a 和 b 组 
成 的 字符 串 ， 但 没 法 修改 它 以 识别 由 等 量 的 三 种 字符 组 成 的 字符 串 ('abc' 、'aabbcc'、 
'aaabbbccc'……)， 因 为 关于 a 的 数量 的 信息 在 对 b 计数 的 过 程 中 被 破坏 了 。 

撤 开 能 用 的 向 栈 中 推送 字符 的 次 数 ， 栈 的 后 进 先 出 属性 也 会 引起 信息 存储 和 获取 的 问题 。 
PDA 能 识别 回 文 ， 但 它 不 能 识别 "abab' 和 "baaabaaa' 这 样 “ 双 倍 ” 的 字符 串 ， 因 为 一 旦 
信息 被 推 入 到 栈 中 ， 就 只 能 以 相反 的 顺序 处 理 了 。 












































如 果 我 们 抛 开 识别 字符 串 的 特定 问题 ， 而 把 这 些 机 器 看 成 通用 目的 的 计算 机 ， 就 可 以 看 到 
DFA、NFA 和 PDA 还 远 远 不 够 有 用 。 首 先 ， 它 们 都 没有 像样 的 输出 机 制 ， 它们 通过 进入 
接受 状态 表达 成 功 ， 但 不 能 输出 哪怕 一 个 字符 (更 不 用 说 由 字符 组 成 的 字符 串 了 ) 来 表示 
详细 的 结果 。 无 法 将 信息 发 送 回 世界 意味 着 它们 连 把 两 个 数 相 加 这 样 的 简单 算法 都 实现 不 
了 。 而 像 有 限 自 动机 一 样 ，PDA 有 一 个 固定 的 程序 ， 没有 明显 的 方法 构建 出 一 台 PDA 能 
以 某 种 方式 从 输入 读 取 一 个 程序 然后 运行 。 


所 有 这 些 缺 点 意味 着 我 们 需要 一 个 更 好 的 计算 模型 ， 去 真正 地 研究 计算 机 能 干什么 ， 而 这 
正 是 下 一 章 的 内 容 。 
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终极 机 器 





在 第 3 章 和 第 4 章 ， 我 们 研究 了 简单 计算 模型 的 能 力 。 我 们 已 经 看 到 如 何 识别 复杂 性 逐渐 
增加 的 字符 串 、 如 何 匹配 正则 表达 式 ， 以 及 如 何 解析 编程 语言 ， 而 且 都 是 使 用 不 太 复 杂 的 
基本 机 器 完成 的 。 





但 我 们 也 看 到 ， 这 些 机 器 一 一 有 限 自 动机 和 下 推 自动 机 一 一 都 有 很 严格 的 限制 ， 这 些 限制 
影响 了 它们 作为 现实 计算 模型 的 使 用 。 我 们 的 小 型 系统 还 要 多 强大 ， 才 能 摆脱 这 些 限制 并 
完成 正常 计算 机 的 所 有 工作 呢 ? 它 还 要 多 复杂 才能 对 RAM 或 硬盘 的 行为 以 及 合适 的 输出 
机 制 建 模 呢 ? 怎么 才能 设计 一 台 能 实际 运行 程序 而 不 总 是 执行 某 个 硬 编码 任务 的 机 器 呢 ? 

















20 世纪 30 年 代 ， 阿 兰 图 灵 (Alan Turing) 致力 于 从 本 质 上 解决 这 个 问题 。 在 那个 年 代 ， 
单词 computer 意味 着 一 个 人 ， 通 常 是 一 个 女人 ， 她 手工 重复 着 一 系列 繁重 的 数学 性 操作 以 
执行 长 长 的 计算 。 图 灵 当 时 正在 寻找 一 种 理解 和 描述 “人 肉 计算 机 ”操作 特征 的 方法 ， 这 
样 同 样 的 工作 就 可 以 完全 由 机 器 执行 。 本 章 ， 我 们 将 看 到 图 灵 关 于 设计 最 简单 的 “自动 化 
机 器 ”的 思想 ， 这 一 机 器 具有 手工 计算 的 全 部 能 力 和 复杂 性 。 


一 2 
5.1 确定 型 图 灵机 
在 第 4 章 ， 我 们 通过 给 一 台 有 限 自动 机 赋予 一 个 作为 外 部 存储 的 栈 ， 增 强 了 它 的 计算 能 
力 。 与 由 机 器 状态 提供 的 有 限 内 部 存储 相 比 ， 栈 的 真正 优点 是 能 动态 增长 以 适应 任意 数量 
的 信息 ， 从 而 使 下 推 自 动机 能 够 处 理 那 些 需 要 存储 任意 数量 数据 的 问题 。 
但 是 ， 外 部 存储 这 种 特殊 的 形式 给 如 何 使 用 存储 之 后 的 数据 带 来 了 限制 。 通 过 把 栈 替 换 成 
更 灵活 的 存储 机 制 ， 我 们 可 以 消除 这 些 限 制 并 进一步 提高 能 
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5.1.1 存储 
计算 通常 可 以 通过 在 纸 上 写 某 些 符号 完成 。 我 们 可 以 把 这 张 纸 想象 成 小 朋友 的 算 
术 本 ， 它 被 划分 成 了 一 个 个 方 格 。 在 初等 算术 里 ， 我 们 有 时 也 会 使 用 纸 的 二 维特 
性 。 但 这 种 使 用 通常 是 可 以 避免 的 ， 并 且 我 认为 纸 的 二 维 性 不 是 计算 的 本 质 ， 而 
且 相 信 大 家 也 赞同 我 这 一 观点 。 我 假定 计算 是 在 一 张 一 维 的 纸 上 完 成 的 ， 比 如 在 
一 条 分 成 方 格 的 纸 带 上 完成 。 


一 一 阿兰 .图 灵 ,《 论 可 计算 数 及 其 在 判定 性 问题 上 的 应 用 》， 
http://dx.doi.org/10.1112/plms/s2-42.1.230 


图 灵 的 做 法 是 给 一 台 机 器 配 上 一 条 无 限 长 的 空 纸 带 (实际 上 是 一 个 两 端 都 能 随 需 增长 的 一 
维 数 组 )， 并 且 人 允许 在 纸 带 上 的 任意 位 置 读 写字 符 。 一 条 纸 带 既 做 存储 又 做 输入 : 可 以 在 
纸 带 上 预先 填 满 字符 串 当 作 输 入 ， 然 后 机 器 在 执行 过 程 中 可 以 读 取 这 些 字符 并 在 必要 的 时 
候 履 盖 它 们 。 


能 访问 一 条 无 限 长 纸 带 的 有 限 状态 自动 机 叫 作 图 灵机 (Turing Machine，TM )。 这 个 
名 字 通 常 指 一 条 拥有 确定 性 规则 的 机 器 ， 但 我 们 也 可 以 毫 无 歧义 地 叫 它 确 定型 图 灵机 
(Deterministic Turing Machine, DTM ) 。 


我 们 已 经 知道 ， 下 推 自动 机 只 能 访问 其 外 部 存储 的 一 个 固定 位 置 〈 栈 的 顶部 )， 但 这 似乎 
对 图 灵机 来 说 限制 性 太 强 了 。 提 供 一 条 纸 带 的 目的 就 是 允许 在 纸 带 上 的 任何 位 置 存储 任意 
量 的 数据 ， 并 以 任意 顺序 读 取 ， 那 么 我 们 如 何 设计 一 台 能 与 整 条 纸 带 交互 的 机 器 呢 ? 


一 种 选择 是 让 纸 带 可 以 被 随机 寻 址 访问 ， 就 像 计算 机 的 RAM 一 样 给 每 个 方 格 标记 一 个 独 
立 的 数字 地 址 ， 这 样机 器 可 以 立即 读 取 和 写 入 任何 位 置 。 这 增加 了 不 必要 的 复杂 性 ， 而 且 
需要 规划 出 细节 上 的 东西 ， 比 如 如 何 给 一 条 无 限 纸 带 的 所 有 方 格 分 配 地 址 ， 以 及 在 它 需要 
访问 方 格 时 如 何 指定 方 格 的 地 址 。 


传统 的 图 灵机 不 是 这 样 ， 而 是 使 用 更 简单 的 安排 : 用 一 个 纸 带 头 (tape head) 指向 纸 带 的 
一 个 特定 位 置 ， 并 且 只 能 在 那个 位 置 读 取 或 写 和 字符。 每 一 步 计算 之 后 ， 纸 带头 都 可 以 向 
左 或 者 向 右 移 动 一 个 方 格 ， 这 意味 着 一 台 图 灵机 为 了 到 达 远 处 的 位 置 只 能 费力 地 在 纸 带 上 
往复 移动 。 使 用 移动 缓慢 的 纸 带 头 不 会 影响 机 器 访问 纸 带 上 任何 数据 的 能 力 ， 只 会 影响 花 
费 的 时 间 ， 因 此 为 了 保持 简单 付出 这 个 代价 是 值得 的 。 


能 访问 纸 带 之 后 ， 除 了 能 够 接受 或 者 拒绝 字符 串 ， 我 们 又 能 解决 新 的 问题 了 。 例 如 ， 我 们 
可 以 设计 一 台 在 纸 带 上 就 地 递增 一 个 二 进 制 数 的 DTM。 为 此 ， 我 们 需要 知道 如 何 递增 一 
个 二 进 制 数 的 一 位 数字 。 幸 好 这 很 简单 : 如果 这 位 的 数字 是 0， 就 用 1 替换 ， 如 果 这 位 数 
是 1， 就 用 0 替换， 然后 立即 使 用 同样 的 方法 增加 它 左 边 的 数字 (“ 进 1 位 ")。 图 灵机 上 内需 
要 使 用 这 个 过 程 递增 二 进 制 数 的 最 右 位 ， 然 后 把 纸 带 头 移 到 起 始 位 置 。 


。 给 机 器 赋予 三 个 状态 (状态 1、 状态 2、 状态 3)， 状 态 3 作为 接受 状态 。 
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。 机 器 从 状态 1 开始 ， 纸 带头 指向 一 个 二 进 制 数 的 最 右 位 。 

。 处 于 状态 1 并 且 读 到 一 个 0 (或 者 空 中 把 纸 带头 向 右 移 ， 然 后 回 到 
状态 2。 

。 处 于 状态 1 并 且 读 到 一 个 1 时 ， 就 用 0 覆 写 ， 然 后 把 纸 带 头 向 左 移 。 

。 处 于 状态 2 并 且 读 到 一 个 0 或 者 1 时， 就 把 纸 带 头 向 右 移 。 

。 处 于 状态 2 并 且 读 到 空白 时 ， 就 把 纸 带 头 向 左 移 并 转移 到 状态 3。 


在 机 器 试图 递增 一 位 数字 的 时 候 ， 它 处 于 状态 1， 在 移 回 起 始 位 置 时 处 于 状态 2， 结 束 的 
时 候 处 于 状态 3。 下 面 是 初始 纸 带 上 字符 串 为 "1011' 时 对 机 器 执行 的 跟踪 。 纸 带头 当前 指 
向 的 字符 会 由 括号 包围 ， 而 下 划 线 表示 输入 字符 串 某 一 端的 空白 方 格 。 
































状态 是 否 接受 纸 带 内 容 动作 

1 否 _101(1) 写 和 人 0， 左 移 

1 否 —10(1)0_ 写 入 0， 左 移 

1 加 — 1(0)00 写 入 1， 右 移 ， 转 移 到 2 
2 过 —11(0)0_ 右 移 

2 [2 _110(0)_ 右 移 

2 否 1100(_) 左 移 ， 转 移 到 状态 3 

3 是 _110(0) 一 





所 





严格 来 说 ， 把 纸 带 头 移 回 它 的 初始 位 置 并 不 必要 (如 果 我 们 把 状态 2 作为 接 
《4 。 受 状态 ， 则 一 旦 机 器 成 功 地 把 0 替换 成 1， 它 会 立即 停止 ， 而 纸 带 仍 会 包含 
”正确 的 结果 ) ， 但 这 是 一 个 值得 要 的 特性 ， 因 为 它 把 纸 带头 放 到 位 之 后 ， 机 
器 只 要 简单 地 把 状态 改变 回 状态 1 就 可 以 再 次 运行 。 通 过 多 次 运行 机 器 ， 我 
们 可 以 不 断 递增 存储 在 纸 带 上 的 数 。 这 个 功能 可 以 重用 ， 作 为 更 大 机 器 的 一 
部 分 ， 比 如 说 把 两 个 二 进 制 数 相 加 或 相 乘 。 















































5.1.2 规则 
ou 成 “简单 的 操作 ”， 这 些 操作 都 非常 


基本 ,以 至 于 无 法 想象 它们 能 进一步 分 解 。……: 操作 实际 上 是 由 计算 者 的 思维 状 
态 和 被 观察 的 符号 决定 的 …… Ee 计算 者 的 思维 状态 就 确 
定 了 。 


我 们 现在 可 以 构造 一 台 做 这 种 计算 者 工作 的 机 器 了 。 


一 一 阿兰 * 图 灵 ,《 论 可 计算 数 及 其 在 判定 性 问题 上 的 应 用 》 


在 每 一 步 计算 中 ， 可 能 都 有 几 个 “简单 的 操作 ”需要 图 灵机 执行 : 在 纸 带头 的 当前 位 置 读 
取 字 符 ， 在 那个 位 置 写 入 一 个 新 字符 ， 把 纸 带 头 左 移 或 者 右 移 ， 或 者 改变 状态 。 简 单 起 
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见 ， 我 们 没有 为 所 有 这 些 动作 指定 不 同 种 类 的 规则 ， 而 只 是 像 处 理 下 推 自动 机 时 那样 ， 只 
设计 了 一 种 能 灵活 适应 各 种 条 件 的 规则 格式 。 


这 个 统一 的 规则 格式 有 5 部 分 : 


。 机 器 的 当前 状态 ; 

。 必须 出 现在 纸 带 头 当 前 位 置 的 字符 ， 

。 机 器 的 下 一 状态 ; 

。 要 写 入 纸 带 头 当 前 位 置 的 字符 ， 

。 写 入 纸 带 之 后 纸 带 头 的 移动 方向 (向 左 还 是 向 右 )。 

















这 里 我 们 假设 一 台 图 灵机 每 次 执行 规则 ， 都 要 改变 状态 并 向 纸 带 写 一 个 字符 。 就 像 通常 对 
状态 机 的 处 理 那样 ， 如 有 果 我 们 想 要 一 个 规则 不 实际 改变 状态 ， 可 以 让 “下 一 个 状态 ”与 当 
前 状态 相同 ， 与 之 类 似 的 是 ， 如 果 想 要 一 个 规则 不 改变 纸 带 内 容 ， 可 以 把 与 读 到 的 字符 一 
样 的 字符 写 入 纸 带 。 





























我 们 还 假设 了 纸 带 头 每 步 都 要 移动 。 这 就 不 太 可 能 书写 一 个 不 移动 纸 带头 就 
全 4 。 更 新 状态 或 者 纸 带 内 容 的 规则 ， 但 我 们 可 以 通过 一 个 规则 做 出 需要 的 改变 以 
惟 ” 得 到 同样 的 效果 ， 然 后 再 通过 一 个 规则 把 纸 带头 移 回 原始 位 置 。 


























递增 一 个 二 进 制 数 的 图 灵机 写成 这 种 类 型 的 话 将 有 6 个 规则 : 


。 处 于 状态 1 并 且 读 入 一 个 0 时 ， 写 和 一 个 1， 右 移 ， 然 后 进入 状态 2; 

。 处 于 状态 1 并 且 读 入 一 个 1 时 ， 写 入 一 个 0， 左 移 ， 然 后 保持 在 状态 1; 
。 处 于 状态 1 并 且 读 到 一 个 空白 时 ， 写 入 一 个 1， 右 移 ， 然 后 进入 状态 2; 
。 处 于 状态 2 并 且 读 到 一 个 0 时 ， 写 入 一 个 0， 右 移 ， 然 后 保持 在 状态 2， 
。 处 于 状态 2 并 且 读 入 一 个 1 时 ， 写 入 一 个 1， 右 移 ， 然 后 保持 在 状态 2， 
。 处 于 状态 2 并 且 读 到 一 个 空白 时 ， 写 入 一 个 空白 ， 左 移 ， 然 后 进入 状态 3。 














与 在 有 限 自动 机 和 下 推 自动 机 中 使 用 的 图 类 似 ， 我们 也 可 以 展示 机 器 的 状态 和 规则 : 


0/0;R 
/0 1/1;R 
0/1;R 


2 t a G) 


事实 上 ， 除 去 箭头 上 的 标签 ， 这 很 像 一 个 DFA 示意 图 。 标 签 a/b;L 表示 一 条 规则 ， 它 从 纸 
带 上 读 取 字符 a， 写 入 字符 b， 然 后 把 纸 带 头 向 左 移动 一 个 方 格 ; 标签 a/b;R 表示 的 规则 几 
平一 样 ， 只 是 会 把 纸 带 头 向 右 而 不 是 向 左 移动 。 



































我 们 看 一 下 如 何 使 用 图 灵机 解决 下 推 自动 机 无 法 处 理 的 字符 串 识别 问题 ， 要 识别 的 字符 串 
包含 一 个 或 者 多 个 字符 a， 后 面 跟随 着 同样 数目 的 b 和 <c (如 'aaabbbccc' )。 解 决 这 个 问题 
的 图 灵机 有 6 个 状态 和 16 个 规则 : 














它 大 致 像 这 样 工 作 : 


(1) 通过 不 断 把 纸 带 头 向 右 移 扫描 输入 字符 串 ， 直 到 发 现 一 个 a 为止， 然后 通过 用 X 替换 a 
来 把 它 删除 (状态 1) ; 

(2) 向 右 扫描 寻找 一 个 p， 然 后 删除 (状态 2) ; 

(3) 向 右 扫 描 寻 找 一 个 5， ne 

(4) 向 右 扫描 寻找 输入 字符 串 的 结尾 〈 状 态 4) ， 然 后 向 左 扫描 寻找 输入 字符 串 的 开头 ( 状 
态 5) ; 


(5) 重复 这 些 步 又， 直到 所 有 的 字符 都 已 被 删除 为 止 。 






































如 果 输 入 字符 串 是 由 一 个 或 多 个 字符 a 以 及 同样 数目 的 b 和 < 组 成 的 ， 那 么 机 器 将 会 重复 
跨越 整个 字符 串 几 次 ， 每 次 跨越 都 会 删除 一 个 字符 ， 然 后 在 整个 字符 串 都 被 删 掉 的 时 候 进 
入 到 一 个 接受 状态 。 下 面 是 在 输入 为 “aabbpcc 时 的 执行 跟踪 。 








状态 是 否 接受 纸 带 内 容 动作 

1 否 (a)abbcc_ 写 和 人 X， 右 移 ， 转 移 到 状态 2 
2 否 XxX(a)bbcc 右 移 

2 否 Xa(lb)bcc_ _ 写 和 信 X， 右 移 ， 转 移 到 状态 3 
3 否 _ Xax(b)cc 右 移 

3 否 _Xaxb\c)c 写 和 信 X， 右 移 ， 转 移 到 状态 4 
4 否 _XaXbXx(c) 右 移 

4 否 XaxbxXc( ) 左 移 ， 转 移 到 状态 5 

5 否 _XaXbX(c) 左 移 
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状态 是 否 接受 纸 帝 内 容 动作 

5 否 _Xaxb(X)c 左 移 

5 否 _ Xax(b)Xc 左 移 

5 否 __ Xa(X)bxc_ _ 左 移 

5 否 XxX(a)XbxXc _ 左 移 

5 否 _(X)aXbxc_ 左 移 

5 否 _ (CC)XaXpXc 右 移 ， 转 移 到 状态 1 

1 否 _(X)aXbxXc_ 右 移 

1 否 XX(a)Xbxc__ 写 入 X， 右 移 ， 转 移 到 状态 2 
2 否 XX(X)bxXc _ 右 移 

2 否 __ XXX(b)Xc 写 入 X， 右 移 ， 转 移 到 状态 3 
3 否 _ XXXX(X)c 右 移 

3 否 _XXXXX(c)_ 写 入 X， 右 移 ， 转 移 到 状态 4 
4 否 XXXXXX( ) 左 移 ， 转 移 到 状态 5 

5 否 XXXXX(X) 左 移 

5 否 XXXX(X)X 左 移 

5 否 __ XXX(X)XX 左 移 

5 否 XXCXXXX 左 移 

5 否 XX)XXXX__ 左 移 

5 否 XXXXXX_ 左 移 

5 否 _—(_)XXXXXX 右 移 ， 转 移 到 状态 1 

1 否 (XX)XXXXX_ 右 移 

1 否 XX)XXXX__ 右 移 

1 否 __ XX(X)XXX_ 右 移 

1 否 __ XXX(X)XX 右 移 

1 否 _ XXXX(X)X 右 移 

1 否 _XXXXX(X) 右 移 

1 否 XXXXXX(_) 左 移 ， 转 移 到 状态 6 

6 是 _XXXXX(X) 一 





查找 c) 的 时 候 ， 它 能 执行 的 规则 只 能 是 移动 纸 带 头 经 过 b 和 X。 如 果 机 器 遇 到 了 其 他 字 
符 (如 非 期 望 的 a)， 它 是 没有 规则 可 以 遵守 的 ， 在 这 种 情况 下 它 会 进入 隐 含 的 卡 死 状态 停 
止 执 行 ， 并 会 因此 拒绝 这 个 输入 。 





























我 们 通过 假设 输入 只 包含 字符 3、b 和 c 来 保持 简单 ， 但 如 果 不 是 这 样 ， 机 器 也 
人 和 不 会 正常 工作 。 例 如 ， 它 会 接受 字符 串 'XaXXbXxokc' ， 即 使 这 个 字符 串 本 来 应 该 
被 拒绝 。 为 了 正确 地 处 理 这 种 输入 ， 我 们 需要 增加 更 多 的 规则 和 状态 扫描 整个 字 
符 串 ， 以 检查 在 机 器 开始 删除 字符 之 前 这 个 字符 串 不 包含 任何 非 期 望 的 字符 。 
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5.1.3 ”确定 性 
对 于 设计 成 确定 性 的 一 台 特 定 的 图 灵机 ， 它 只 能 遵守 和 确定 性 下 推 自 动机 一 样 的 约束 ( 参 
见 4.1.3 节 )， 但 这 次 我 们 不 用 担心 自由 移动 ， 因 为 图 灵机 没有 自由 移动 。 


要 根据 图 灵机 的 当前 状态 和 当前 纸 带 头 下 的 字符 来 选择 它 的 下 一 个 动作 ， 因 此 一 台 确定 性 
机 器 只 能 有 由 状态 和 字符 组 合成 的 一 个 规则 一 一 “无 矛盾 ”规则 ， 这 是 为 了 避免 下 一 个 动 
作 有 任何 的 歧义 。 简 单 起 见 ， 我 们 会 像 处 理 DPDA 时 那样 ， 放 松 “ 无 遗漏 ”规则 ， 并 假设 
在 没有 规则 可 用 的 时 候 机 器 可 以 进入 一 个 隐 仿 的 卡 死 状态 ， 而 不 是 坚持 对 于 每 一 个 可 能 的 
情况 都 要 有 一 个 规则 。 
































5.1.4 模拟 
我 们 已 经 对 一 台 确 定性 图 灵机 应 该 如 何 工 作 有 了 很 好 的 认识 ， 现 在 来 构建 一 个 Ruby 的 模 
拟 以 便 可 以 看 到 它 的 执行 


























第 一 步 是 实现 图 灵机 的 纸 带 。 很 显然 这 个 实现 不 得 不 存储 写 到 纸 带 上 的 字符 ， 但 它 还 需要 
记 住 纸 带 头 的 当前 位 置 ， 以 便 模拟 出 来 的 机 器 可 以 读 取 当 前 字符 ， 在 当前 位 置 写 入 一 个 新 
的 字符 ， 并 左右 移动 纸 带头 到 达 其 他 位 置 。 


做 到 这 一 点 的 一 ee 部 分 〈 纸 带头 左边 的 全 部 字符 、 纸 带头 下 的 一 
个 字符 、 右 边 的 所 有 字符 )， 分 分 别 存储 。 这 让 读 写 当前 字符 变 得 非常 容易 ， 而 移 
动 纸 带 头 可 以 通过 在 所 有 三 0 曼 移动 字符 实现 。 例 如 ， 向 右 移动 一 个 方 格 ， 意 
es 一 个 字符 ， 而 之 前 纸 带 头 右 边 的 第 一 个 字符 
成 为 了 当前 字符 。 


我 们 的 实现 还 必须 维护 纸 带 无 限 长 而 且 填 满 空白 方 格 的 假象 ， 但 幸好 并 不 需要 一 个 无 限 大 
0 吉 构 。 在 任意 给 定时 刻 唯一 能 被 读 取 的 是 纸 带 头 下 的 位 置 ， 因 此 在 纸 带 头 移动 超出 

经 写 在 纸 带 上 的 有 限 数目 的 非 空 字符 时 。 我 们 只 需 安排 一 个 空白 字符 出 现 。 为 此 ， 我 
I 符 代表 一 个 空白 方 格 ， 然 后 只 要 进入 到 纸 带 上 未 经 探索 的 区 域 ， 就 
可 以 让 这 个 字符 自动 出 现在 纸 带头 下 。 


因此 ， 一 条 纸 带 的 基本 表示 看 起 来 像 这 样 : 















































class Tape < Struct.new(:left, :middle, :right, :blank) 
def inspect 
"#<Tape #{left.join}(#{middle})#{right.join}>" 
end 
end 


因此 可 以 创建 一 条 纸 带 并 读 取 纸 带 头 下 面 的 字符 : 
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>> tape = Tape.new(['1', '0', '1'], '1', [], '_') 
=> #<Tape 101(1)> 

>> tape.middle 

3 


我 们 可 以 增加 操作 ， 向 当前 纸 带 位 置 ` 写 入 并 把 纸 带 头 左右 移动 : 


class Tape 
def write(character) 
Tape.new(left, character, right, blank) 
end 


def move head left 
Tape.new(left[0..-2], left.last || blank, [middle] + right, blank) 
end 


def move head right 
Tape.new(left + [middle], right.first || blank, right.drop(1), blank) 
end 
end 


现在 可 以 向 纸 带 写 入 ， 并 来 回 移动 纸 带 头 : 








>> tape 

=> #<Tape 101(1)> 

>> tape.move head left 

=> #<Tape 10(1)1> 

>> tape.write('0') 

=> #<Tape 101(0)> 

>> tape.move head right 

=> #<Tape 1011( )> 

>> tape.move head right.write('0') 
=> #<Tape 1011(0)> 


在 第 4 章 ， 我 们 使 用 配置 一 词 来 代表 下 推 自动 机 状态 和 栈 的 组 合 ， 同 样 的 理念 在 这 里 也 会 
很 有 帮助 。 可 以 说 一 个 图 灵机 的 配置 是 一 个 状态 和 一 条 纸 带 的 组 合 ， 并 且 可 以 直接 处 理 这 
些 配置 的 图 灵机 规则 : 




















class TMConfiguration < Struct.new(:state, :tape) 
end 


class TMRule < Struct.new(:state, :character, :next state, 
:write character, :direction) 
def applies to?(configuration) 
state == configuration.state && character == configuration.tape.middle 
end 
end 


只 有 在 机 器 的 当前 状态 和 纸 带 头 下 的 当前 字符 与 其 表达 式 匹 配 时 ， 规 则 才能 应 用 : 








注 1: 就 像 栈 一 样 ， 纸 带 是 纯 功 能 性 的 : 写 入 纸 带 和 移动 纸 带 头 都 是 非 破 坏 性 操作 ， 只 会 返回 一 个 新 的 
Tape， 而 不 是 更 新 已 有 的 对 象 。 


























大 
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>> rule = TMRule.new(1, '0', 2, '1', :right) 
=> #<struct TMRule 

state=1, 

character="0", 

next_state=2， 

write character="1", 

direction=:right 

> 

>> rule.applies to?(TMConfiguration.new(1, Tape.new([], '0', [], '_'))) 
=> true 
>> rule.applies to?(TMConfiguration.new(1, Tape.new([], '1', [], '_'))) 
=> false 
>> rule.applies to?(TMConfiguration.new(2, Tape.new([], '0', [], '_'))) 
=> false 





知道 一 个 规则 能 在 一 个 特定 的 配置 下 应 用 之 后 ， 我 们 需要 能 够 通过 写 入 一 个 新 字符 、 移 动 
纸 带 头 以 及 按照 规则 改变 机 器 状态 来 更 新 该 配置 ; 


class TMRule 
def follow(configuration) 
TMConfiguration.new(next_state, next tape(configuration)) 
end 


def next tape(configuration) 
written tape = configuration.tape.write(write character) 


case direction 
when :left 
written tape.move head left 
when :right 
written tape.move head right 
end 
end 
end 


这 些 代码 看 起 来 工作 得 很 好 : 


>> rule.follow(TMConfiguration.new(1, Tape.new([], '0', [], '_'))) 
=> #<struct TMConfiguration state=2, tape=#<Tape 1(_)>> 


DTMRulebook 的 实现 TT DFARulebook 和 DPDARulebook 一 样 ， 只 是 方法 #next_configuration 
没有 用 字符 作为 参数 ， 这 是 因为 没有 外 部 的 输入 可 供 读 取 字符 (只 有 纸 带 ， 而 纸 带 已 经 是 
配置 的 一 部 分 了 ) : 


class DTMRulebook < Struct.new(:rules) 
def next_configuration(configuration) 
rule for(configuration).follow(configuration) 
end 


def rule for(configuration) 
rules.detect { |rule| rule.applies to?(configuration) } 
end 
end 
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我 们 现在 可 以 为 “递增 二 进 制 数 ” 的 图 灵机 创建 一 个 DTMRulepook， 并 手工 单 步 执行 一 些 
配置 ; 


>> 





rulebook = DTMRulebook.new([ 
TMRule.new(1, '0', 2, '1', :right), 
TMRule.new(1, '1', 1, '0', :left), 
TMRule.new(1, '_', 2, '1', :right), 
TMRule.new(2, '0', 2,'0', :right), 
TMRule.new(2, '1', 2, '1', :right), 
TMRule.new(2, ' ', 3, '_', :left) 

]) 


#<struct DTMRulebook rules=[...]> 

configuration = TMConfiguration.new(1, tape) 

#<struct TMConfiguration state=1, tape=#<Tape 101(1)>> 
configuration = rulebook.next_configuration(configuration) 
#<struct TMConfiguration state=1, tape=#<Tape 10(1)0>> 
configuration = rulebook.next configuration(configuration) 
#<struct TMConfiguration state=1, tape=#<Tape 1(0)00>> 
configuration = rulebook.next configuration(configuration) 
#<struct TMConfiguration state=2, tape=#<Tape 11(0)0>> 


把 所 有 这 些 封装 成 一 个 DTM 类 很 方便 ， 这 样 就 像 第 2 章 里 实现 小 步 语义 时 那样 ， 我 们 可 以 
有 #step 和 #run 方法 : 


cl 


en 





ass DIM < Struct.new(:current configuration, :accept states, :rulebook) 
def accepting? 

accept states.include?(current configuration.state) 
end 


def step 
self.current configuration = rulebook.next configuration(current configuration) 
end 


def run 

step until accepting? 
end 
d 











我 们 现在 有 了 一 台 确 定型 图 灵机 的 模拟 ， 因 此 给 它 一 些 输入 试验 一 下 : 

















dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
#<struct DIM ...> 

dtm.current_configuration 

#<struct TMConfiguration state=1, tape=#<Tape 101(1)>> 
dtm.accepting? 

false 

dtm. step; dtm.current configuration 

#<struct TMConfiguration state=1, tape=#<Tape 10(1)0>> 
dtm.accepting? 

false 

dtm.run 

nil 

dtm.current configuration 
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=> #<struct TMConfiguration state=3, tape=#<Tape 110(0) >> 
>> dtm.accepting? 
=> true 





就 像 对 待 DPDA 模拟 一 样 ， 为 了 能 优雅 地 处 理 卡 死 状 态 的 图 灵机 我 们 需要 再 多 做 一 些 





工作 : 


>> tape = Tape.new(['1', '2', '1'], '1', [], '_') 

=> #<Tape 121(1)> 

>> dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
=> #<struct DTM ...> 

>> dtm.run 

NoMethodError: undefined method 'follow' for nil:NilClass 


这 次 我 们 不 需要 一 个 卡 死 状 态 的 特殊 表示 了 。 与 PDA 不 同 ， 图 灵机 没有 外 部 输入 ， 因 此 








可 以 通过 看 它 的 规则 手册 和 当前 配置 判断 其 是 否 处 于 卡 死 状 态 : 





class DTMRulebook 
def applies to?(configuration) 
!rule for(configuration).nil? 
end 
end 


class DTM 
def stuck? 
laccepting? 8&& !rulebook.applies to?(current configuration) 
end 


def run 
step until accepting? || stuck? 
end 
end 


现在 模拟 会 注意 到 它 卡 住 了 并 且 自 动 停止 : 


>> dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
=> #<struct DTM ...> 

>> dtm.run 

=> nil 

>> dtm.current configuration 

=> #<struct TMConfiguration state=1, tape=#<Tape 1(2)00>> 

>> dtm.accepting? 

=> false 

>> dtm.stuck? 

=> true 


只 是 为 了 好 玩 ， 下 面 是 我 们 之 前 看 到 的 用 来 识别 'aaabbbccc' 这 样 的 字符 串 的 图 灵机 .: 


>> rulebook = DTMRulebook.new([ 
# 状态 1: 向 右 扫描 ， 查 找 a 
TMRule.new(1, 'X', 1, 'X', :right), # 跳 过 X 
TMRule.new(1，'a'，2，'X'，:right),# 删除 a， 进 入 状态 2 
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TMRule.new(1,，''，6，'"''，:left)， # 查找 空格 ， 进 入 状态 6 (接受 ) 
# 状态 2， 向 右 扫 描 ， 查 找 b 

TMRule.new(2，'"'a'，2，"'a'，:right), # 跳 过 a 
TMRule.new(2，'X'，2，'X'，:right), # 跳 过 X 
TMRule.new(2，'b'，3，'X'，:right)，# 删除 b， 进 入 状态 3 


# 状态 3， 向 右 扫 描 ， 查 找 < 
TMRule.new(3，'b',3，'b'，:right), # 跳 过 b 
TMRule.new(3，'X'，3，'X'，:right), # 跳 过 X 
TMRule.new(3，'c'，4，'X'，:right),# 删除 c， 进 入 状态 4 


# 状态 4， 向 右 扫 描 ， 查 找 字符 串 结束 标记 
TMRule.new(4, 'c', 4,'c'， :right), # 跳 过 c 
TMRule.new(4,，'_'，5，'_'，:left)，# 查找 空格 ， 进 入 状态 5 


# 状态 5: 向 左 扫描 ， 查 找 字 符 串 开始 标记 
TMRule.new(5,，'a',，5，"'a'，:left)，# 跳 过 a 
TMRule.new(5，'b'"，5， "b'，:left)，# 跳 过 b 
TMRule.new(5，"c" ，5，"c" ，:left)， # 跳 过 < 
TMRule.new(5，'X' ，5， "X' ，:left)，# 跳 过 X 
TMRule.new(5,，"' '，1，' '，:right) # 查找 空格 ， 进 入 状态 1 


=> #<struct DTMRulebook rules=[...]> 

>> tape = Tape.new([], 'a'’, ['a’, 'a’, 'b', 'b'’, 'b'’, 'c', 'c', 'c'], '_') 
=> #<Tape (a)aabbbccc> 

>> dtm = DTM.new(TMConfiguration.new(1, tape), [6], rulebook) 

=> #<struct DTM ...> 

>> 10.times { dtm.step }; dtm.current configuration 

=> #<struct TMConfiguration state=5, tape=#<Tape XaaXbbXc(c) >> 
>> 25.times { dtm.step }; dtm.current configuration 

=> #<struct TMConfiguration state=5, tape=#<Tape XXa(X)XbXXc >> 
>> dtm.run; dtm.current_configuration 

=> #<struct TMConfiguration state=6, tape=#<Tape XXXXXXXX(X)_>> 





这 个 实现 很 容易 构建 ， 只 要 我 们 有 了 表示 纸 带 和 规则 手册 的 数据 结构 ， 模 拟 一 台 图 灵机 并 
不 难 。 当 然 ， 阿 兰 ， 图 灵 特 意 让 它们 保持 简单 以 便 容易 构建 和 推导 ， 并 且 我 们 将 在 之 后 
(5.4 节 ) 看 到 实现 的 简单 性 也 是 一 个 重要 属性 。 


5.2 非 确定 型 图 灵机 


在 3.4 节 中 ， 我 们 看 到 非 确 定性 没有 让 有 限 自动 机 有 什么 不 同 ， 而 4.2.2 节 表 明 一 台 非 确定 
性 的 下 推 自动 机 比 一 台 确 定性 的 能 多 做 一 些 事情 ， 这 留 给 我 们 一 个 明显 的 关于 图 灵机 的 问 
题 : 增加 不 确定 性 ”会 使 一 台 图 灵机 更 强大 吗 ? 



































答案 是 不 会 : 一 台 非 确定 型 图 灵机 并 不 能 比 一 台 确 定型 图 灵机 多 做 任何 事情 。 下 推 自动 机 
是 个 例外 ， 因 为 DFA 和 DTM 都 有 足够 的 能 力 模拟 甚 非 确定 性 的 对 应 机 器 。 有 限 自 动机 的 


























注 2: 对 于 一 台 图 灵机 ,“ 不 确定 性 ”意味 着 每 个 状态 和 字符 的 组 合 会 允许 多 于 一 个 的 规则 ， 因 此 从 一 个 起 
始 配置 开始 会 有 多 个 可 能 的 执行 路 径 。 
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一 个 状态 能 用 来 表示 许多 状态 的 组 合 ， 而 图 灵机 的 一 条 纸 带 能 用 来 存储 许多 纸 带 的 内 容 ， 
但 一 个 下 推 自 动机 的 栈 无 法 同时 表示 多 个 可 能 的 栈 。 


因此 ， 就 像 有 限 自 动机 一 样 ， 一 台 确 定型 图 灵机 可 以 模拟 一 台 非 确定 型 图 灵机 。 使 用 纸 带 
存储 由 图 灵机 配置 适当 编码 后 组 成 的 一 个 队列 ， 每 一 个 配置 都 包含 一 个 可 能 的 当前 状态 和 
所 模拟 机 器 的 纸 带 ， 模 拟 就 靠 它 运 行 。 模 拟 开始 的 时 候 ， 纸 带 上 只 存 有 一 个 配置 ， 它 表示 
所 模拟 机 器 的 初始 配置 。 模 拟 计 算 的 每 一 步 执 行 都 是 先 读 取 队 列 前 面 的 配置 ， 找 到 能 用 的 
每 一 个 规则 ， 并 使 用 这 个 规则 生成 新 的 配置 ， 再 把 配置 写 回 纸 带 放 到 队 尾 。 一 旦 对 每 一 个 
规则 都 这 样 做 了 ， 最 前 面 的 配置 会 被 擦 除 ， 然 后 会 再 次 对 队列 中 的 下 一 个 配置 进行 处 理 。 
这 个 机 器 模拟 的 步 又 会 一 直 重 复 ， 直 到 队列 前 面 的 配置 表示 机 器 已 经 到 达 接 受 状态 为 止 。 
































这 个 技术 允许 确定 型 图 灵机 按照 广度 优先 的 顺序 探索 被 模拟 机 器 的 所 有 可 能 配置 。 如 果 对 
于 非 确 定型 图 灵机 来 说 存在 一 条 执行 路 径 到 达 一 个 接受 状态 ， 模 拟 就 会 找到 它 ， 就 算 其 他 
路 径 会 导致 无 限 循环 也 没有 关系 。 实 际 上 把 这 个 模拟 实现 为 一 个 规则 手册 要 求 大 量 的 细 
市 ， 因 此 我 们 不 会 在 这 里 进行 尝试 ， 但 能 够 用 确定 型 图 灵机 模拟 就 意味 着 我 们 不 能 仅仅 通 
过 增加 非 确定 性 就 让 一 台 图 灵机 更 强大 。 


5.3 ”最 大 能 力 

确定 型 图 灵机 代表 了 从 有 限 计 算 机 器 到 全 能 机 器 的 临界 点 。 实 际 上 ， 通 过 升级 图 灵机 规范 
以 使 其 更 强大 的 任何 尝试 都 注定 失败 ， 因 为 它们 本 来 就 有 能 力 模 拟 任何 潜在 的 增强 了 。° 
尽管 增加 某 些 特性 会 使 图 灵机 更 小 巧 或 者 更 高 效 ， 但 无 法 从 根本 上 增强 它们 的 能 


我 们 之 前 已 经 看 到 了 对 于 非 确 定性 来 说 为 什么 这 是 对 的 。 现 在 来 看 一 下 对 传统 图 灵机 的 4 个 
其 他 扩展 一 一 内 部 存储 、 子 例 程 、 多 纸 带 以 及 多 维 纸 带 一 一 并 领会 为 什么 它们 中 没有 一 个 
可 以 增强 计算 能 力 。 尽 管 涉 及 的 模拟 技术 很 复杂 ， 但 到 最 后 ， 它 们 都 只 不 过 是 编程 方面 的 
问题 。 


5.3.1 内 部 存储 

为 图 灵机 设计 规则 手册 非常 让 人 诅 形 ， 因 为 它们 缺少 随机 的 内 部 存储 。 例 如 ， 我 们 经 常 想 
要 机 器 把 纸 带 头 移动 到 一 个 特定 的 位 置 ， 读 取 存 在 那儿 的 字符 ， 然 后 移动 到 另 一 个 不 同 的 
部 分 ， 再 根据 之 前 读 到 的 字符 执行 某 个 动作 。 表 面 看 来 ， 这 似乎 不 太 可 能 ， 因 为 没有 地 方 
能 让 机 器 “ 记 住 ”那个 字符 一 一 当然 它 仍 旧 写 在 纸 带 上 ， 并 且 只 要 我 们 喜欢 ， 就 可 以 把 纸 
带头 移动 回 到 那里 再 次 对 其 读 取 ， 但 只 要 纸 带 头 从 那个 方 格 移 开 了 ， 我 们 就 再 也 不 能 根据 
它 的 内 容 触发 一 个 规则 了 。 

















































































































注 3: 严格 来 讲 ， 只 有 我 们 实际 知道 如 何 实现 的 增强 才 算数 。 如 果 赋 了 予 一 台 图 灵机 魔力 ， 让 它 能 立即 推理 出 
传统 图 灵机 无 法 回答 的 问题 的 答案 ， 它 确实 会 变 得 更 强大 ， 但 实际 上 ， 这 是 无 法 做 到 的 。 
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如 果 图 灵机 有 一 些 临时 性 的 内 部 存储 (可 以 叫 它 “RAM”“ 寄 存 器 *”“ 本 地 变量 ”， 等 等 ) 
会 更 方便 ， 其 中 可 以 保存 纸 带 当前 方 格 的 字符 ， 而 且 即 使 以 后 纸 带 头 已 经 完全 移动 到 了 不 


同 的 部 分 ， 也 能 对 其 引用 。 实 际 上 ， 如 果 一 台 














图 灵机 有 这 个 能 力 ， 我 们 就 疫 必要 限制 它 存 


储 纸 带 上 的 字符 : 它 可 以 存储 任何 相关 的 信息 ， 比 如 机 器 执行 计算 的 中 间 结 末 ， 从 而 把 我 


们 从 来 回 移动 纸 带 头 向 纸 带 写 
图 灵机 执行 新 类 型 的 任务 了 。 


能 让 














回 碎片 数据 的 繁琐 工作 中 解放 上 





8 来 。 这 个 额外 的 灵活 性 好 像 


就 像 非 确定 性 一 样 ， 为 图 灵机 增加 额外 的 内 部 存储 确实 会 让 某 些 任务 更 容易 执行 ， 但 它 
并 不 能 让 机 器 做 任何 它 本 来 不 能 完成 的 工作 。 把 中 间 结 果 存 在 机 器 内 部 而 不 是 纸 带 上 的 


念头 很 容易 消除 ， 因 为 即使 让 纸 带 头 来 


























回 移动 访问 这 些 信息 





要 花费 些 工 夫 ， 用 纸 带 存储 


这 种 信息 也 能 工作 得 很 好 。 但 我 们 不 得 不 更 加 认真 地 看 待 这 个 记忆 字符 的 点 ， 因 为 如 果 


纸 带 头 移动 到 其 他 地 方 之 后 就 不 能 利用 之 前 纸 带 方 格 里 











会 非常 有 限 。 


幸好 





图 灵机 有 非常 完美 的 内 部 存储 

















的 内 容 的 话 ， 一 台 图 灵机 的 作用 





它 的 当前 状态 。 图 灵机 可 用 的 状态 数目 没有 上 限 ， 


但 对 于 任意 的 特定 规则 集合 来 说 ， 这 个 数目 一 定 是 有 限 的 并 且 要 预先 决定 好 ， 因 为 无 法 在 
计算 过 程 中 创建 新 的 状态 。 如 果 必 要 ， 我 们 可 以 设计 一 台 拥 有 100 个 、1000 个 ， 甚 至 10 
亿 个 状态 的 机 器 ， 然 后 使 用 当前 状态 记 住 从 一 步 到 下 一 步 任 意 数量 的 信息 。 


这 意味 着 免不了 要 复制 规则 适应 多 个 状态 ， 











因为 这 些 状态 除了 “ 记 住 ”的 信息 不 同 外 都 





是 相同 的 。 一 台 机 器 不 是 只 用 一 个 状态 表示 “向 右 扫 描 查 找 一 个 空白 方 格 "， 而 是 可 以 为 
“向 右 扫描 查找 一 个 空白 方 格 ( 记 住 我 之 前 读 取 到 了 一 个 3)” 设置 一 个 状态 ， 再 为 “向 右 
扫描 查找 一 个 空白 方 格 ( 记 住 我 之 前 读 取 到 了 一 个 b)” 设 置 另 一 个 状态 ， 所 有 可 能 的 字符 
都 以 此 类 推 一 一 字符 数目 也 是 有 限 的 ， 所 以 这 样 的 复制 总 是 有 限 的 。 





下 














>> rulebook = DTMRulebook.new([ 


# 状态 1: 从 磁带 读 取 第 一 个 字符 

TMRule.new(1，"a'，2，"'a'，:ITight)，# 记 住 a 
TMRule.new(1，'b',，3，'b'，:right), # 记 住 b 
TMRule.new(1，'c',，4，'c'，:right), # 记 住 < 


# 状态 2: 向 右 扫 描 ， 查 找 字符 串 结束 标记 〈 记 住 a) 
TMRule.new(2，'a'，2，"'a'，:right), # 跳 过 a 
TMRule.new(2,，'b',，2，'b'，:right), # 跳 过 b 
TMRule.new(2,'c', 2,'c'，:right), # 跳 过 c 
TMRule.new(2，' '，5， "a'，:ITight)，# 找到 空格 ， 写 a 
# 状态 3: 向 右 扫描 ， 查 找 字符 串 结束 标记 〈 记 住 b) 
TMRule.new(3, 'a', 3,'a', :right), # 跳 过 a 
TMRule.new(3，'b'，3，'b'，:right), # 跳 过 b 
TMRule.new(3,'c', 3，'c'，:right), # 跳 过 c 
TMRule.new(3，'"'_'，5，'b'，:right)，# 找到 空格 ， 写 b 


# 状态 4: 向 右 扫 描 ， 查 找 字 符 串 结束 标记 ( 记 住 c) 


硬是 一 个 使 用 这 种 技术 的 图 灵机 ， 它 会 把 一 个 字符 从 字符 串 的 开头 复制 到 结尾 : 





138 


第 5 章 


TMRule.new(4, 'a', 4, 
TMRule.new(4, 'b', 4, 
TMRule.new(4, 'c', 4, 
TMRule.new(4, ' _', 5, 


'a' 
‘pb’ 
‘ec 
‘ec 


4 
3 
Ea 
3》 


:right), # 跳 过 a 
:Tight)，# 跳 过 b 
:Tight)，# 跳 过 < 
:right) # 查找 空格 ， 写 c 


]) 
=> #<struct DTMRulebook rules=[...]> 
>> tape = Tape.new([], 'b', ['c'’, 'b', 'c', 'a'], '_') 


=> #<Tape (b)cbca> 


>> dtm = DTM.new(TMConfiguration.new(1, tape), [5], rulebook) 


=> #<struct DTM ...> 


>> dtm.run; dtm.current configuration.tape 


=> #<Tape bcbcab( )> 


a/a;R 
b/b;R 
c/csR 








除了 它们 每 一 个 所 表示 的 机 器 记 住 的 字符 串 开头 字符 不 同 之 外 ， 这 台 机 器 的 状态 2、3 和 4 
几乎 完全 相同 ， 并 且 在 这 种 情况 下 ， 在 到 达 末 端的 时 候 它 们 都 做 了 一 些 不 同 的 事情 。 


有 

















这 台 机 器 只 对 由 字符 a、b、c 组 成 的 字符 串 起 作用 。 如 果 想 要 其 对 由 字母 表 
4 4 ， 里 任意 字母 组 成 的 字符 串 起 作用 (或 者 字母 数字 字符 ， 或 者 我 们 选择 的 更 大 
心 ， 集合) ， 必 须 加 入 多 得 多 的 状态 (为 可 能 需要 记 住 的 每 一 个 字符 设置 一 个 状 





态 )， 还 得 加 入 多 得 多 的 与 之 匹配 的 规则 。 








如 采用 这 种 方式 利用 当前 状态 ， 我 们 可 以 设计 出 任凭 纸 带 头 来 回 移动 仍 能 记 住 之 前 任何 组 
合 的 图 灵机 ， 这 实际 上 与 给 一 台 机 器 提供 明确 的 “寄存 器 ”作为 内 部 存储 有 同样 的 能 力 ， 
只 不 过 代价 是 使 用 了 大 量 的 状态 。 
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5.3.2 ” 子 例 程 


一 台 图 灵机 的 规则 手册 是 一 个 很 长 的 、 由 极为 低层 次 的 指令 组 成 的 硬 编码 列表 ， 因 此 在 写 
这 些 规则 时 不 忽略 机 器 应 该 执行 的 高 层次 任务 如 果 存 在 调用 子 例 程 的 方法 ， 
设计 一 个 规则 手册 会 更 容易 一 些 : 如 果 机 器 的 某 个 部 分 能 把 所 有 这 些 规则 存储 成 子 例 程 ， 
比如 说 叫 “ 递 增 一 个 数 ”， as 
“现在 递增 一 个 数 "， 就 能 让 一 个 数 自 增 。 或 许 这 一 次 这 种 额外 的 灵活 性 能 让 我 们 设计 出 拥 
有 新 能 力 的 机 器 。 


但 这 实际 上 只 是 又 一 个 关于 便利 性 而 不 是 能 力 的 特性 。 就 像 有 限 自动 机 实现 正则 表达 式 片 
段 一 样 (参见 3.3.2 节 ) ， 几 个 小 图 灵机 可 以 连接 在 一 起 组 成 更 大 的 图 灵机 ， 其 中 每 一 个 小 
机 器 都 实际 上 扮演 着 子 例 程 的 角色 。 我 们 之 前 看 到 的 递增 二 进 制 数 的 机 器 ， 甚 状态 和 规则 
可 构建 入 一 个 把 两 个 二 进 制 数 相 加 的 大 一 些 的 机 器 ， 而 这 个 加 法 器 本 身 还 能 构建 成 可 执行 
乘法 的 更 大 的 机 器 。 















































在 小 机 器 只 需要 由 大 机 器 的 单个 状态 “调用 ”时 ， 这 很 容易 安排 : 只 需要 包含 进 小 机 器 

的 副本 ， 并 把 它 的 起 始 状态 和 接受 状态 与 大 机 器 的 状态 在 子 例 程 调用 应 该 开始 和 结束 的 
地 方 合并 。 这 是 我 们 使 用 递增 机 器 组 成 一 个 加 法 器 时 期 望 的 方式 ， 因 为 规则 手册 的 总 体 
设计 会 根据 需要 重复 单个 任务 一 一 “如 果 第 一 个 数 不 是 0， 就 递减 第 一 个 数 并 递增 第 二 
个 数 " 。 在 机 器 中 递增 只 需要 发 生 在 一 个 地 方 ， 而 且 在 递增 的 工作 完成 之 后 只 会 有 一 个 地 
方 继续 执行 。 





























在 我 们 想 要 在 整个 机 器 中 的 多 个 地 方 调用 一 个 特定 的 子 例 程 时 ， 唯 一 的 困难 才 会 出 现 。 一 
台 图 灵机 没有 办 法 存储 “返回 地 址 ”， 以 让 子 例 程 知 道 一 旦 它 结束 之 后 应 该 返回 到 哪个 状 
态 ， 因 此 从 表面 上 说 ， 我 们 不 能 支持 这 种 更 通用 的 代码 重用 。 但 是 就 像 在 5.3.1 节 做 的 那 
样 ， 可 以 用 复制 解决 此 问题 ,我们 不 是 只 构建 较 小 机 器 状态 和 规则 的 一 份 副本 ， 而 是 会 构 
建 出 许多 份 ， 较 大 机 器 中 需要 使 用 的 每 一 个 地 方 都 对 应 一 份 。 


例如 ， 把 “递增 一 Te 转换 成 “给 一 个 数 加 三 ”的 机 器 ， 最 简单 的 方式 是 把 三 份 
副本 连接 到 一 起 完成 “递增 一 个 数 ， 然后 递增 一 个 数 再 递 曾 一 个 数 ” 的 总 体 设计 。 这 通 
过 几 个 中 间 状 态 跟 踪 通 向 最 终 目 标的 过 程 ， 其 中 每 一 个 都 从 “递增 这 个 数 ”发 起 ， 然 后 返 
一 个 不 同 的 中 间 状 态 。 





























O/05R 0/0;R 0/0;R 
1/0;L 1/1;R 1/0;L 1/1;R Wo 1/1;R 
0/1;R - ~ 








>> def increment rules(start state, return state) 
incrementing = start _ state 





finishing = Object.new 
finished = return state 


[ 


TMRule.new(incrementing, '0', finishing, '1', :right), 
TMRule.new(incrementing, '1', incrementing, '0', :left), 
TMRule.new(incrementing, '_', finishing, '1', :right), 
TMRule.new(finishing, '0', finishing, '0', :right), 
TMRule.new(finishing, "1', finishing, '1', :right), 
TMRule.new(finishing, "_', finished, Left 

] 

end 

=> nil 


>> added zero, added one，added two, added three = 0, 1, 2, 3 
=> [0， 1，2， 3] 
>> rulebook = DTMRulebook.new( 

increment rules(added zero, added one) + 

increment_ rules(added one, added two) + 

increment rules(added two, added three) 


=> #<struct DTMRulebook rules=[...]> 

>> rulebook.rules.length 

=> 18 

>> tape = Tape.new(['1', '0', '1'], '1', [], '_') 

=> #<Tape 101(1)> 

>> dtm = DTM.new(TMConfiguration.new(added zero, tape), [added three], rulebook) 
=> #<struct DTM ...> 

>> dtm.run; dtm.current configuration.tape 

=> #<Tape 111(0) > 


只 要 我 们 能 接受 机 器 规模 的 扩张 ， 用 这 种 方式 组 合 状 态 和 规则 的 能 力 可 以 构建 任意 大 小 和 
复杂 度 的 图 灵机 ， 无 需 任何 对 子 例 程 的 明确 支持 。 


5.3.3 ”多 纸 带 

有 时 候 机 器 可 以 通过 扩展 它 的 外 部 存储 提高 能 力 。 例 如 ， 在 一 台 下 推 自动 机 可 以 访问 第 二 
个 栈 的 时 候 ， 它 会 变 得 更 强大 ， 因 为 两 个 栈 可 以 用 来 模拟 一 个 无 限 纸 带 : 每 一 个 栈 存 储 一 
半 要 模拟 的 纸 带 ， 而 这 台 PDA 可 以 在 两 个 栈 之 间 弹 出 和 推 入 字符 以 模拟 纸 带 头 的 动作 ， 
就 像 5.1.4 节 中 的 Tape 实现 那样 。 任 何 能 访问 无 限 纸 带 的 有 限 状 态 机 实际 上 都 是 一 台 图 灵 
机 ， 因 此 很 明显 增加 一 个 额外 的 栈 会 让 一 台 下 推 自动 机 更 强大 。 























因此 有 理由 期 待 通过 增加 一 条 或 者 多 条 纸 带 也 能 让 图 灵机 更 强大 ， 这 些 纸 带 都 有 自己 独立 
的 纸 带 头 。 但 事实 又 一 次 不 是 这 样 。 一 条 图 灵机 的 纸 带 通过 交叉 存 取 ， 会 有 足够 的 空间 存 
储 任意 纸 带 数目 的 内 容 : 包含 abc、def 和 ghi 的 三 条 纸 带 可 以 一 起 存 成 adgbehcfi。 如 采 
我 们 在 每 一 个 交叉 字符 的 边 上 放 上 一 个 空白 方 格 ， 机 器 就 有 地 方 指示 所 有 模拟 的 纸 带 头 的 
位 置 了 : 通过 使 用 字符 X 指示 每 个 纸 带 头 的 当前 位 置 ， 我 们 可 以 用 一 条 纸 带 a_dxg_b_e_ 
hxcXf_i_ 表示 纸 带 ab(c)、(d)ef 和 g(h)i 的 内 容 和 纸 带头 的 位 置 。 
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使 用 多 条 模拟 的 纸 带 对 一 台 图 灵机 编程 非常 复杂 ， 但 累 人 的 读 、 写 以 及 纸 带 头 的 移动 都 可 
以 封装 成 专门 的 状态 和 规则 (“ 子 例 程 ")， 这 样机 器 的 主要 逻辑 就 不 会 变 得 过 于 复杂 。 在 
任何 情况 下 ， 不 管 编程 多 么 不 方便 ， 一 台 单 纸 带 的 图 灵机 最 终 都 能 执行 多 纸 带 机 器 能 执行 
的 任何 任务 ， 因 此 为 一 台 图 灵机 增加 额外 的 纸 带 并 不 会 带 来 新 的 能 





























5.3.4 ”多 维 纸 带 

最 后 ， 尝 试 给 一 台 图 灵机 更 广阔 的 存储 空间 是 很 有 诱惑 力 的 。 我 们 可 以 不 使 用 线性 纸 带 ， 
而 是 提供 无 限 的 二 维 网 格 ， 并 允许 纸 带 头 上 下 左右 移动 。 每 次 需要 移动 纸 带 头 快速 访问 外 
部 存储 的 特定 部 分 时 ， 这 都 会 很 有 用 ， 而 且 不 需要 移动 纸 带 头 经 过 其 他 方 格 ， 这 还 人 允许 我 们 
在 多 个 字符 串 周 围 留 下 无 限 的 空白 空间 ， 这 样 它们 中 每 一 个 都 很 容易 变 长 ， 而 不 是 每 次 在 我 
们 想 要 插入 一 个 字符 的 时 候 只 能 手工 整理 整个 纸 带 的 信息 以 腾 出 空间 来 。 


但 不 出 意外 的 是 ， 能 用 一 维 纸 带 模拟 一 个 网 格 。 最 简单 的 方式 就 是 使 用 两 个 一 维 纸 带 : 主 
纸 带 实际 存储 数据 ， 从 纸 带 用 来 作为 擦 写 空间 。 所 模拟 网 格 “ 的 每 一 行 都 存储 在 主 纸 带 上 ， 
顶 上 的 行 优先 ， 并 用 一 个 特殊 的 字符 标识 每 一 行 的 结尾 。 


主 纸 带 的 头像 往常 一 样 位 于 当前 字符 ， 因 此 为 了 在 模拟 网 格 上 左右 移动 ， 机 器 只 是 简单 地 
左右 移动 纸 带 头 。 如 果 纸 带头 指向 了 行 尾 的 标识 符 ， 就 会 用 一 个 子 例 程 整理 纸 带 以 便 让 网 
格 扩展 出 一 个 空间 。 


为 了 在 模拟 网 格 中 上 下 移动 ， 纸 带头 必须 向 左 或 者 向 右 分 别 移 动 完 整 的 一 行 。 机 器 会 先 移 
动 纸 带头 到 当前 行 的 开头 或 者 结尾 ， 并 使 用 从 纸 带 记录 移动 的 距离 ， 然 后 把 纸 带 头 在 前 一 
行 或 者 下 一 行 移动 同样 的 偏 移 量 。 如 果 纸 带头 离开 了 所 模拟 网 格 的 最 顶部 或 者 最 底部 ， 可 
以 使 用 一 个 子 例 程 分 配 一 个 纸 带 头 能 移动 进去 的 新 空 行 。 









































这 个 模拟 确实 要 求 一 台 机 器 有 两 条 纸 带 ， 但 对 此 我 们 也 知道 如 何 模 拟 。 这 样 最 终 把 模拟 的 
网 格 存 储 在 两 条 模拟 的 纸 带 上 ， 而 这 两 条 纸 带 本 身 存储 在 一 条 原始 的 纸 带 上 。 这 两 层 模 拟 
引入 了 大 量 的 额外 规则 和 状态 ， 而 且 执 行 所 模拟 机 器 的 一 步 就 要 花 很 多 步 ， 但 规模 的 增加 
和 速度 的 减 慢 并 不 妨碍 它 〈 最 终 ) 完成 本 来 应 该 做 的 事情 。 


5.4 通用 机 器 


尽管 到 目前 为 止 我 们 看 到 的 机 器 都 有 严重 的 缺陷 ; 它们 的 规则 都 是 硬 编码 的 ， 这 让 它们 无 
法 适应 不 同 的 任务 。 一 台 能 接受 与 一 个 特定 正则 表达 式 匹 配 的 字符 串 的 DFA， 不 可 能 学 会 
接受 一 个 不 同 集合 的 字符 串 ， 一 台 能 识别 回 文 的 NPDA 将 只 能 识别 回 文 ， 一 台 递增 二 进 制 
数 的 图 灵机 将 永远 不 能 做 其 他 用 途 。 












































注 4: 尽管 网 格 本身 是 无 限 的 ， 但 只 可 能 写 入 有限 数目 的 字符 ， 因 此 我 们 只 需要 存储 包含 所 有 空白 字符 的 矩 
区 域 即 可 。 
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大 多 数 现 实 中 的 计算 机 不 是 这 么 工作 的 。 现 代 计算 机 不 是 专门 做 某 一 项 特殊 工作 的 ， 而 是 
为 了 通用 目的 而 设计 的 并 且 能 通过 编程 执行 不 同 的 任务 。 尽 管 一 台 可 编程 计算 机 的 指令 集 
和 CPU 设计 是 固定 的 ， 但 能 通过 软件 控制 它 的 硬件 并 根据 用 户 需要 改变 它 的 行为 。 

我 们 的 简单 机 器 能 做 这 样 的 事情 吗 ? 在 做 一 件 不 同 的 工作 时 ， 不 必 每 次 去 设计 一 台新 的 机 
器 ， 而 是 设计 一 台 简 单机 器 ， 它 会 从 输入 读 取 一 个 程序 ， 然 后 做 这 个 程序 定义 的 任何 工 
作 。 这 办 得 到 吗 ? 














或 许 不 足 为 奇 的 是 ， 一 台 图 灵机 足够 强大 ， 它 能 从 纸 带 读 取 一 台 简 单机 器 的 描述 一 一 比如 
说 ， 一 台 确 定性 有 限 自动 机 一 一 然后 运行 这 人 台 机 器 的 模拟 以 找 出 它 的 工作 内 容 。 在 3.1.4 
节 ， 我 们 根据 描述 写 下 Ruby 代码 来 模拟 一 台 DFA， 现 在 只 需要 一 点 点 工作 就 可 以 把 那个 
代码 的 思想 转化 成 一 台 图 灵机 的 规则 手册 ， 以 运行 同样 的 模拟 。 





























AS 区 别 。 
Le 四 


4 能 模拟 一 台 特 定 DFA 的 图 灵机 和 一 台 能 模拟 任何 DFA 的 图 灵机 有 着 重要 的 
CA 
' 














设计 一 台 图 灵机 重 现 一 台 特定 DFA 的 行为 很 简单 一 一 毕 竞 ， 一 台 图 灵机 只 
不 过 是 一 台 装 有 纸 带 的 确定 性 有 限 自动 机 。DFA 规则 手册 的 每 一 条 规则 都 可 
以 直接 转 成 一 个 等 价 的 图 灵机 规则 ， 每 一 个 转换 过 来 的 规则 不 是 从 DFA 的 
外 部 输入 流 中 读 取 ， 而 是 从 纸 带 读 取 一 个 字符 ， 并 把 纸 带 头 移动 到 下 一 个 方 
格 。 但 这 不 是 特别 有 趣 ， 因 为 得 到 的 图 灵机 并 不 比 原始 的 DFA 有 用 。 
































更 有 趣 的 是 模拟 通用 DFA 的 图 灵机 。 这 样 的 机 器 可 以 从 纸 带 读 取 一 个 DFA 
的 设计 一 一 规则 、 起 始 状态 以 及 接受 状态 一 一 然后 遍历 那 台 DFA 执行 的 每 
一 步 ， 同 时 使 用 另 一 部 分 纸 带 跟踪 模拟 机 器 的 当前 状态 和 剩余 的 输入 。 通 用 
模拟 实现 起 来 要 难得 多 ,但 它 让 我 们 只 要 提供 DFA 的 描述 作为 输入 ， 就 可 
以 让 图 灵机 做 一 台 DFA 能 做 的 任何 工作 。 














这 也 适用 于 对 NFA、DPDA 和 NPDA 的 Ruby 模拟 ， 它 们 都 可 以 转换 成 能 模拟 那 种 类 型 
的 任意 自动 机 的 一 台 图 灵机 。 但 关键 是 ， 对 我 们 图 灵机 模拟 本 身 ， 它 也 能 起 作用 : 通过 把 
Tape、TMRule、DTMRulebook 以 及 DTM 重新 实现 成 图 灵机 的 规则 ， 我 们 能 设计 一 台 图 灵机 ， 
它 能 通过 从 纸 带 读 取 其 规则 、 接 受 状态 以 及 起 始 配 置 然 后 单 步 执 行 ， 模 拟 任 何其 他 确定 型 
图 灵机 ， 本 质 上 这 扮演 着 图 灵机 规则 手册 解释 器 的 角色 。 完 成 这 种 工作 的 机 器 叫 作 通用 图 
灵机 (Universal Turing Machine, UTM ) 。 















































这 非常 激动 人 心 ， 因 为 它 在 一 个 可 编程 装置 中 使 图 灵机 的 最 大 计算 能 力 变 得 可 用 。 我 们 可 
以 把 软件 一 一 经 过 编码 的 图 灵机 描述 一 一 写 到 纸 带 上 ， 把 这 个 纸 带 提供 给 UTM， 然 后 执 
行 软件 产生 想 要 的 行为 。 有 限 自动 机 和 下 推 自动 机 不 能 用 这 种 方式 模拟 它们 自身 的 类 型 ， 
因此 图 灵机 不 只 标志 着 从 能 力 有 限 的 计算 机 器 到 能 力 强大 的 计算 机 器 的 过 渡 ， 还 标志 着 从 
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单 用 途 设 备 到 全 编程 设备 的 转变 。 


简单 地 看 一 下 一 台 通 用 图 灵机 如 何 工作 。 在 实际 构建 一 台 UTM 时 ， 涉 及 大 量 的 技巧 和 无 
趣 的 技术 细节 ， 因 此 我 们 的 探索 将 会 相当 肤浅 ， 但 至 少 应 该 能 证 明 这 样 的 事情 是 可 能 的 。 

















5.4.1 编码 

在 设计 一 台 UTM 的 规则 手册 之 前 ， 我 们 得 决定 如 何 把 一 台 完 整 的 图 灵机 表示 成 纸 带 上 的 
一 个 字符 序列 。 一 台 UTM 需要 读 取 任意 图 灵机 的 规则 、 接 受 状态 以 及 起 始 配置 ， 然 后 随 
着 模拟 的 进程 ， 不 断 更 新 模拟 机 器 的 当前 配置 ， 因 此 我 们 需要 一 个 实用 的 方式 存储 这 些 信 
息 ， 以 便 UTM 能 与 其 协同 工作 。 


有 一 个 挑战 ， 即 每 一 台 图 灵机 都 只 能 在 它 的 纸 带 上 存储 有 限 数目 的 状态 和 有 限 数目 的 不 同 
字符 ， 这 两 个 数 都 由 它 的 规则 手册 预先 固定 好 了 ， 当 然 UTM 也 不 例外 。 如 果 我 们 设计 一 
台 UTM， 它 能 处 理 10 个 不 同 的 纸 带 字符 ， 那 它 如 何 模拟 一 台 规 则 里 使 用 11 个 字符 的 机 
器 呢 ? 如 果 我 们 更 慷慨 一 些 ， 让 它 能 处 理 100 个 不 同 的 字符 ， 那 么 当 想 要 模拟 使 用 1000 
个 字符 的 机 器 时 会 发 生 什么 呢 ? 不 管 我 们 为 UTM 自己 的 纸 带 设计 多 少 个 字符 ， 为 了 直接 
表示 每 一 个 可 能 的 图 灵机 它 总 是 不 够 用 的 。 













































































在 所 模拟 机 器 和 UTM 之 间 还 会 有 字符 冲突 的 风险 。 为 了 在 纸 带 上 存储 图 灵机 的 规则 和 配 
置 ， 我 们 需要 能 够 用 在 UTM 中 有 特殊 含义 的 字符 标注 它们 的 边界 ， 以 便 它 能 告诉 我 们 从 
哪儿 开始 一 个 规则 结束 了 ， 另 一 个 规则 开始 了 。 但 如 有 果 我 们 选择 x 作为 规则 之 间 的 特定 标 
识 ， 则 只 要 所 模拟 的 任何 一 条 规则 中 含有 字符 X， 都 会 有 问题 。 即 使 我 们 设置 一 个 保留 字 
符 的 超级 特殊 集合 ， 只 给 一 台 通 用 图 灵机 使 用 ， 如 果 试 图 模拟 这 台 UTM 本 身 的 话 仍然 会 
引起 问题 ， 因 此 机 器 不 会 是 真正 通用 的 。 这 表明 ， 我 们 需要 某 种 转 义 ， 以 避免 所 模拟 机 器 
的 普通 字符 被 UTM 错误 地 解释 成 特殊 字符 。 


我 们 可 以 解决 这 两 个 问题 ， 方 法 是 对 所 模拟 机 器 的 纸 带 内 容 使 用 固定 指令 系统 的 字符 进行 
编码 。 如 果 编 码 体系 只 使 用 了 特定 的 字符 ， 那 么 我 们 可 以 保证 对 UTM 来 说 把 其 他 字符 做 
特殊 目的 使 用 是 安全 的 ， 而 且 如 果 这 个 体系 能 容纳 任意 数目 的 模拟 状态 和 模拟 字符 ， 那 就 
没有 必要 担心 所 模拟 机 器 的 规模 和 复杂 度 了 。 


















































只 要 能 实现 这 些 目标 ， 这 个 编码 体系 的 具体 细节 并 不 重要 。 举 个 例子 ， 一 个 可 能 的 方法 是 
使 用 一 元 表示 法 把 不 同 的 值 编码 成 同一 字符 重复 不 同 次 数 的 字符 串 : 如 果 所 模拟 机 器 使 
用 字符 a、b 和 c， 它 们 可 以 编码 成 1、11 和 111。 另 一 个 字符 ， 如 0， 可 以 用 来 作为 值 的 
分 界 标识 : 字符 串 abc 可 以 标识 成 101110110111。 这 种 方法 在 空间 上 效率 不 是 很 高 ， 但 它 
可 以 通过 在 纸 带 上 存储 越 来 越 长 的 由 1 组 成 的 字符 串 来 进行 扩展 ， 以 容纳 任意 数目 的 编码 
的 字符 。 



































注 5: 二 元 基于 2， 一 元 基于 1。 
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一 且 决 定 了 如 何 对 单个 字符 进行 编码 ， 我 们 就 需要 一 种 描述 所 模拟 机 器 规则 的 方法 。 可 以 
通过 对 规则 的 各 个 部 分 (状态 、 字 符 、 下 一 状态 、 要 写 入 的 字符 、 移 动 方向 ) 进行 编码 来 
实现 ， 然 后 把 它们 在 纸 带 上 连接 在 一 起 ， 并 在 必要 的 地 方 使 用 特殊 的 分 隔 符 。 在 示例 的 编 
码 系统 里 ， 我 们 也 可 以 用 一 元 法 表示 状态 一 一 状态 1 是 1， 状 态 2 是 11， 以 此 类 推 。 但 既 
然 知 道 只 会 有 两 个 方向 ， 那 我 们 可 以 使 用 任意 的 专用 字符 表示 左 和 右 (比如 说 L 和 R)。 


我 们 可 以 把 单个 的 规则 连 到 一 起 表示 整个 规则 和 手册。 类似 地 ， 可 以 通过 把 它 当 前 状态 的 表 
示 和 它 当 前 纸 带 内 容 的 表示 连 在 一 起 ， 来 对 所 模拟 机 器 的 当前 配置 进行 编码 。" 而 且 这 给 
了 我 们 想 要 的 : 一 台 完 整 的 图 灵机 以 字符 串 的 形式 写 在 另 一 台 图 灵机 的 纸 带 上 ， 准 备 通过 
模拟 开始 自己 的 生命 周期 。 












































5.4.2 ”模拟 


从 根本 上 说 ， 通 用 图 灵机 和 我 们 在 5.1.4 节 构 建 的 Ruby 模拟 的 工作 方式 一 样 ， 只 是 要 费力 
得 多 。 


所 模拟 机 器 的 描述 一 一 它 的 规则 手册 、 接 受 状态 以 及 起 始 配置 一 一 都 以 编码 的 格式 存在 于 
UTM 的 纸 带 上 。 为 了 执行 模拟 的 一 步 ，UTM 要 在 规则 、 当 前 状态 和 所 模拟 机 器 的 纸 带 之 间 
来 回 移动 纸 带 头 ， 以 搜索 出 能 应 用 到 当前 配置 的 一 条 规则 。 它 找到 一 条 规则 的 时 候 ， 就 会 根 
据 规则 里 定义 的 字符 和 方向 ， 更 新 所 模拟 的 纸 带 ， 并 把 所 模拟 的 机 器 放 到 新 的 状态 上 去 。 


这 个 过 程 会 一 直 重 复 ， 直 到 所 模拟 的 机 器 进入 到 一 个 接受 状态 ， 或 者 到 达 某 个 配置 后 因为 
没有 规则 应 用 处 于 卡 死 的 状态 。 


























注 6: 我 们 没有 详细 说 明 纸 带 应 该 如 何 表示 ， 但 这 也 不 难 ， 而 且 总 是 可 以 选用 5.3.3 市 的 多 纸 带 技术 把 它 存 
储 到 所 模拟 的 从 纸 带 上 。 
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第 二 部 分 


计算 与 可 计算 性 





在 本 书 的 第 一 部 分 ， 我们 已 经 讨论 了 儿 个 熟悉 的 计算 示例 : 命令 式 编程 语言 状态 机 ， 以 
及 通用 计算 机 。 那 些 示 例 向 我 们 展示 了 计算 差不多 就 是 使 用 一 个 系统 操纵 信息 并 回答 问题 
的 过 程 。 


在 第 二 部分， 我 们 将 会 大 胆 些 ， 先 在 不 熟悉 的 地 方 寻求 计算 ， 最 后 探索 关于 计算 机 器 所 能 
做 之 事 的 根本 限制 。 


作为 程序 员 ， 我 们 与 编程 语言 和 机 器 打交道 ， 它 们 是 根据 我 们 对 世界 的 认 知 模型 进行 设计 
的 ， 而 且 我 们 期 望 它 们 带 有 一 些 特 性 ， 能 轻松 地 把 我 们 的 思想 转换 成 实现 。 这 些 以 人 为 中 
心 的 设计 是 由 便利 性 而 非 必 要 性 驱动 的 ， 甚 至 一 台 设 计 简单 的 图 灵机 ， 也 会 让 我 们 想起 用 
纸 和 铅笔 工作 的 数学 家 。 


但 是 计算 并 不 只 会 发 生 在 友好 的 、 为 我 们 所 熟悉 的 机 器 上 。 更 多 不 寻常 的 系统 的 计算 能 
同样 强大 ， 即 使 它们 内 部 的 工作 机 制 对 于 人 类 来 说 不 容易 控制 或 理解 。 我 们 将 探索 这 个 思 
想 ， 在 第 6 章 尝 试用 极 小 的 语言 (这 种 语言 似乎 根本 没什么 有 用 的 特性 ) 写 程序 ， 并 在 第 
7 章 审 视 各 种 简单 的 系统 ， 看 看 它们 如 何 像 更 复杂 的 机 器 一 样 执 行 同样 的 计算 。 


在 确信 许多 种 系统 里 都 可 能 发 生 强大 的 计算 后 ， 第 8 章 将 探讨 计算 本 身 的 能 力 。 人 们 很 
自然 地 认为 ， 只 要 付出 足够 的 时 间 和 努力 写 一 个 合适 的 程序 ， 就 能 让 计算 机 解决 几乎 任 
何 问题 ， 但 事实 证 明了 存在 一 个 理论 约束 : 有 些 问 题 无 法 用 任何 计算 机 解决 ， 不 管 它 多 
快 多 高 效 。 
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遗憾 的 是 ， 一 些 不 能 解决 的 问题 涉及 程序 行为 的 预测 ， 而 这 恰好 是 程序 员 想 要 计算 机 帮 他 
们 做 的 。 我 们 将 会 看 到 一 些 应 对 计算 世界 中 这 些 硬 限制 的 策略 ， 而 第 9 草 将 探索 如 何 利用 
抽象 找 出 无 法 回答 的 问题 的 近似 答案 。 
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第 6 章 


从 零 开始 编程 





如 果 你 想 从 头 开始 制作 蔷 果 派 ， 必 须 先 创造 整个 宇宙 。 
一 一 卡尔 萨 根 





本 书 中 ， 我 们 一 直 在 试图 构建 计算 模型 来 理解 计算 。 到 目前 为 止 ， 我 们 设计 了 想象 中 带 有 
不 同 约束 的 简单 机 器 ， 并 看 到 不 同 的 约束 会 产生 出 拥有 不 同 计算 能 力 的 系统 ， 以 此 对 计算 
进行 了 建 模 。 





第 5 章 的 图 灵机 很 有 意思 ， 因 为 它们 不 依赖 复杂 的 特性 就 能 实现 复杂 的 行为 。 只 要 有 一 条 
纸 带 、 一 个 读 写 头 以 及 一 个 固定 的 规则 集合 ， 图 灵机 就 足以 模拟 拥有 更 好 存储 能 力 、 支 持 
非 确定 性 执行 或 者 任何 其 他 奇妙 特性 的 机 器 行为 。 这 告诉 我 们 ， 成 熟 的 计算 不 需要 机 器 具 
备 大 量 的 潜在 复杂 性 ， 只 需要 其 具备 存储 、 检 索 以 及 使 用 数据 进行 简单 决策 的 能 


计算 模型 不 一 定 非 要 看 起 来 像 机 器 ， 它 们 可 以 看 起 来 像 编程 语言 。 第 2 章 的 Simple 编程 
语言 当然 可 以 执行 计算 ， 但 它 的 执行 过 程 没 有 图 灵机 那么 优雅 。 它 已 经 有 了 大 量 语 法 ( 数 
字 、 布 尔 值 、 二 进 制 表达 式 、 变 量 、 赋 值 、 序 列 、 条 件 、 循 环 ) ， 而 且 我 们 甚至 还 没有 开 
始 为 其 增加 特性 ， 以 使 其 适合 写真 正 的 程序 : 字符 串 、 数 据 结构 、 过 程 调用 ， 等 等 。 















































把 Simple 转换 成 真正 有 用 的 编程 语言 将 会 是 一 项 艰苦 的 工作 ， 最 终 的 设计 会 包含 大 量 的 细 
市 ， 不 会 对 揭示 计算 的 本 质 帮助 太 多 。 从 零 开始 创建 某 个 最 小 的 东西 一 一 编程 语言 世界 的 
一 台 图 灵机 ， 这 样 我 们 就 可 以 看 到 对 于 计算 来 说 ， 哪 些 特性 是 本 质 的 ， 哪 些 特性 是 偶然 的 


噪音 。 








本 章 ， 我 们 将 研究 一 种 叫 作 无 类 型 lambda 演算 (untyped lambda calculus) 的 极 小 编程 语 
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言 。 首 先 ， 我 们 将 用 尽 可 能 少 的 语言 特性 写 〈 用 Ruby) 一 些 接近 lambda 演算 的 程序 。 这 
将 仍然 仅仅 是 在 用 Ruby 编程 ， 但 施加 虚构 的 约束 之 后 ， 我 们 便 能 很 轻松 地 探索 一 个 受 限 
的 语义 ， 而 不 需要 学 习 一 门 新 语言 。 然 后 ， 我 们 了 解 到 这 些 非常 有 限 的 特性 集合 能 做 什么 
以 后 ， 就 将 利用 这 些 特 性 把 它们 实现 为 一 种 语言 〈 使 用 它 自己 的 解析 器 、 抽 象 语法 和 操作 
语义 ) 一 一 使 用 我 们 在 之 前 章节 中 学 到 的 技术 。 


6.1 模拟 lambda 演 算 


为 了 理解 如 何 使 用 最 小 语言 编程 ， 我 们 不 打算 使 用 Ruby 诸多 有 用 的 特性 来 解决 问题 。 很 
自然 ， 这 意味 着 没有 gem， 没 有 标准 库 ， 没 有 模块 (module)、 方 法 、 类 或 者 对 象 ， 既 然 
我 们 试图 尽 可 能 地 做 到 最 小 ， 那 还 将 避免 使 用 控制 结构 、 赋 值 、 数 组 、 字 符 串 、 数 字 和 布 
尔 值 。 

当然 ， 如 果 我 们 避免 使 用 Ruby 的 所 有 特性 ， 那 就 没有 语言 可 用 来 编程 了 ， 因 此 下 再 
要 保留 的 : 

。 对 变量 进行 引用 ， 

。 创建 proc; 

。 调用 proc。 


















































这 意味 着 只 能 写 出 如 下 样子 的 Ruby 代码 : 


-> xX{ ->Yy{x.call(ly)}} 


过 | 





这 大 致 就 是 无 类 型 ambda 演算 程序 的 样子 ， 足 以 接近 我 们 的 目的 了 。6.2 节 
、 会 详细 讨论 lambda 演算 。 








为 了 让 代码 更 简短 并 且 更 容易 阅读 ， 我 们 还 将 使 用 常量 作为 缩写 : 如果 创建 了 一 个 复杂 的 
表达 式 ， 可 以 把 它 赋 值 给 一 个 常量 ， 给 它 一 个 短 名 字 以 便 以 后 再 次 使 用 。 引 用 这 个 名 字 与 
重新 输入 原始 表达 式 没 有 区 别 (名字 只 是 让 代码 更 加 简洁 )， 因 此 我 们 会 依赖 于 Ruby 的 赋 
值 特性 。 任 意 时 刻 都 可 以 通过 替换 每 一 个 常量 所 引用 的 proc 来 取消 缩写 ， 这 样 做 的 代价 是 
会 让 程序 变 得 更 长 。 





6.1.1 使 用 proc 工 作 
既然 要 用 proc 构建 整个 程序 ， 让 我 们 在 次 度 使 用 它们 之 前 花 一 分 钟 看 看 它们 的 属性 。 








目前 ， 我 们 将 使 用 完整 特性 的 Ruby 来 描绘 proc 的 一 般 行为 。 在 我 们 开始 写 
。 代码 来 解决 6.12 节 的 “问题 ”时 ， 才 会 施加 这 些 限 制 。 











1. 管道 


proc 是 值 在 程序 中 进行 移动 的 管道 。 考 虑 调用 下 面 的 proc 时 会 发 生 什么 : 














->x{x+2}.call(1) 











作为 参数 提供 给 调用 的 值 1， 传 人 代码 块 x 的 参数 中 ， 然 后 把 参数 传 给 用 到 它 的 所 有 地 方 ， 
因此 Ruby 最 后 会 对 1+2 求 值 。 语 言 的 其 他 部 分 会 做 实际 的 工作 ，proc 只 是 把 一 部 分 程序 
连接 在 一 起 并 让 值 流向 需要 它 的 地 方 。 

对 使 用 最 小 化 Ruby 的 实验 来 说 这 已 经 有 了 不 好 的 兆头 。 如 果 proc 只 能 在 实际 使 用 值 的 
Ruby 片段 之 间 移 动 值 ， 那 怎么 才能 只 用 proc 就 能 构建 有 用 的 程序 呢 ? 探索 完 proc 的 其 他 
属性 之 后 ， 我 们 就 会 理解 。 


2. 参数 
proc 可 以 带 有 多 个 参数 ， 但 这 不 是 一 个 本 质 特性 。 如 有 果 得 到 一 个 能 处 理 多 个 参数 的 












































-> x, yl 
半 寺 Y 
}.call(3, 4) 


ee 我 们 总 是 可 以 将 其 重 写 为 幅 入 式 的 单 参数 proc: 


->x{ 
芭 人 | 
x+y 
} 
}.call(3).call(4) 








这 里 ， 外 部 proc 的 参数 是 x， 而 且 会 返回 内 部 的 proc， 内 部 的 proc 也 带 有 一 个 参数 y。 我 
们 可 以 使 用 x 的 一 个 值 调 用 外 部 的 proc， 然 后 使 用 y 的 一 个 值 调用 内 部 的 proc， 而 且 我 们 
会 得 到 与 多 参数 时 同样 的 结果 。， 


既然 我 们 在 尽 可 能 多 地 去 掉 Ruby 的 特性 ， 那 就 限制 自己 只 创建 和 调用 单 参数 的 proc 吧 。 
这 不 会 让 事情 变 得 更 糟糕 。 


3. 等 价 

查 明 一 个 proc 内 部 代码 的 唯一 途径 就 是 调用 它 ， 因 此 如 果 使 用 同样 的 参数 调用 两 个 proc， 
会 产生 相同 结果 的 话 ， 那 么 即使 它们 的 内 部 代码 不 同 ， 它 们 也 是 可 交换 的 。 这 种 根据 外 部 
可 见 行为 判断 两 者 相等 的 思想 叫 作 外 迁 等 价 (extensional equality ) 。 
































比如 说 我 们 有 一 个 叫 p 的 proc: 





注 1: 这 叫 作 curry 化 ， 并 且 我 们 可 以 使 用 Proc#curry 自动 进行 这 个 转换 。 
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>>p=->n{n*2} 
=> #<Proc (lambda)> 














我 们 可 以 再 创建 一 个 叫 q 的 proc， 它 带 有 一 个 参数 并 且 只 是 用 这 个 参数 调用 p: 





>>q= -> x { p.call(x) } 
=> #<Proc (lambda)> 


p 和 9q 明显 是 两 个 不 同 的 proc， 但 它们 外 延 相等 ， 因 为 它们 对 任何 参数 来 讲 都 会 做 同样 的 
事情 : 

>> p.call(5) 

=> 10 

>> q.call(5) 

=> 10 
知道 p 与 -> x { p.call(x) } 等 价 ,这 就 为 重 构 提 供 了 新 的 机 会 。 如 果 在 我 们 的 程序 里 看 到 
-> x { p.call(x) } 这 种 一 般 模式 ,我们 可 以 选择 用 p 替换 整个 表达 式 来 消除 它 ， 而 在 某 
些 情况 下 (后面 会 看 到 )， 我 们 可 能 会 决定 采用 相反 的 方式 。 


4. 语法 
对 于 创建 和 调用 proc，Ruby 提供 了 一 个 语法 选择 。 从 现在 开始 ， 我 们 会 使 用 -> arguments 
{ body } 创建 一 个 proc， 然 后 使 用 方 括 号 调用 它 : 


>> ->x{x+5 }[6] 
=> 11 


这 样 无 需 额外 的 语法 就 很 容易 看 到 proc 的 主体 和 参数 。 





6.1.2 ”问题 
我 们 的 目标 是 写 出 若 名 的 FizzBuzz 程序 : 





写 一 个 程序 输出 数字 1 到 100。 但 如 果 数 字 是 3 的 倍数 ， 就 不 输出 数字 而 是 输出 
“Fizz” ,如果 是 5 的 倍数 就 输出 "Buzz”。 对 于 那些 3 和 5 的 公 倍 数 ,就 输出 "FizzBuzz 。 
一 一 Imran Ghory,“ 用 FizzBuzz 找到 热爱 编码 的 开发 者 ” 

(Using FizzBuzz to Find Developers who Grok Coding, http://imranontech. 
com/2007/01/24/using-fizzbuzz-to-find-developers-who-grok-coding/) 





这 是 故意 挑选 的 一 个 简单 问题 ， 用 来 测试 一 个 面试 者 是 否 有 编程 经 验 。 任 何 知 道 如 何 编程 
的 人 应 该 都 能 毫 无 困难 地 解决 这 个 问题 。 

















下 面 是 使 用 完整 特性 Ruby 的 一 个 实现 : 











(1..100).each do |n| 





if (n % 15).zero? 
puts “FizzBuzz” 
elsif (n % 3).zero? 


puts “Fizz” 

elsif (n % 5).zero? 
puts “Buzz” 

else 
puts n.to_s 

end 


end 


这 不 是 FizzBuzz 最 聪明 的 一 个 实现 (还 存在 着 大 量 更 聪明 的 实现 ，http://redd.it/10d7w)， 
但 它 很 直接 ， 任 何人 都 可 以 不 用 思考 就 写 出 来 。 

但 是 ， 这 个 程序 含有 一 些 puts 语句 ， 而 我 们 没 法 只 使 用 proc 就 把 文本 输出 到 控制 台 ，? 因 
此 我 们 把 它 替换 成 一 个 大 致 等 价 的 程序 ， 这 个 程序 只 返回 一 个 字符 串 数组 而 不 是 输出 它们 : 














(1..100).map do |n| 
if (n % 15).zero? 
'FizzBuzz" 
elsif (n % 3).zero? 
"Fizz" 
elsif (n % 5).zero? 
'Buzz" 
else 
n.to_s 
end 
end 


对 FizzBuzz 问题 来 说 这 仍然 是 一 个 有 意义 的 解决 方案 ， 但 现在 的 这 个 版 本 我 们 有 可 能 只 用 
proc 就 实现 了 。 


不 管 它 多 简单 ， 如 果 没 有 一 种 编程 语言 的 任何 特性 的 话 ， 这 仍然 是 要 求 非常 高 的 程序 ， 它 
创建 一 个 范围 ， 对 其 做 映射 ， 对 一 个 大 的 条 件 求 值 ， 使 用 取 模 操作 进行 算数 运算 ， 使 用 
Fixnum#zero? 预测 ， 使 用 一 些 字符 串 ， 而 且 还 用 Fixnum#to_s 把 数字 转换 成 字符 串 。 这 用 
到 了 很 多 Ruby 内 建功 能 ， 而 我 们 将 要 把 它们 全 部 去 除 再 用 proc 重新 实现 。 





6.1.3 数字 
我 们 准备 从 关注 FizzBuzz 中 出 现 的 数字 开始 。 怎 么 才能 不 用 Fixnum 或 者 Ruby 提供 的 任何 
其 他 数据 类 型 ， 就 表示 出 数字 呢 ? 


如 果 打 算 从 头 开 始 实现 数字 "， 我 们 最 好 对 要 实现 的 东西 有 个 透彻 的 理解 。 到 底 什么 是 数 
字 呢 ? 如 有 果 不 对 试图 定义 的 东西 的 某 个 方面 进行 假设 ， 就 很 难 给 出 一 个 具体 的 定义 。 例 












































注 2: 我 们 当然 可 以 对 向 控制 台 输 出 进行 建 模 , 引入 一 个 proc 来 表示 标准 输出 , 然后 设计 如 何 向 它 发 送 文 本 ， 
但 那 会 让 我 们 的 练习 复杂 化 , 而 且 变 得 没意思 。FizzBuzz 不 是 关于 输出 的 , 而 是 关于 算数 和 控制 流 的 。 
注 3: 具体 说 来 ， 我 们 这 里 想 要 实现 的 是 非 负 整数 : 0、1、2、3 等 。 
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如 ,“ 革 个 东西 告诉 我 们 有 多 少 ……” 没 有 用 ， 因 为 “多 少 ” 只 是 “数字 ”的 另 一 种 表述 
方式 。 





下 面 是 描绘 数字 特征 的 一 种 方式 : 想象 我 们 有 一 袋子 苹果 和 一 袋子 橘子 。 我 们 从 一 个 袋子 
里 取出 一 个 苹果 ， 从 另 一 个 袋子 里 取出 一 个 橘子 ， 然 后 把 它们 放 到 一 起 。 之 后 我 们 不 断 地 
取出 一 个 苹果 和 一 个 橘子 ， 直 到 至 少 其 中 有 一 个 袋子 变 成 空 的 。 


如 有 果 两 个 袋子 同时 变 成 空 的， 我 们 就 学 到 了 一 件 有 趣 的 事情 : 尽管 含有 不 同 的 东西 ， 但 这 
两 个 袋子 有 一 个 共有 的 属性 ， 这 个 属性 意味 着 它们 同时 变 空 了 ， 在 不 断 从 每 个 袋子 里 取出 
水 果 的 每 一 个 时 刻 ， 两 个 袋子 都 不 是 空 的 或 者 两 个 袋子 都 是 空 的 。 袋 子 共 有 的 这 个 抽象 性 
质 就 是 我 们 可 以 叫 作 数 字 的 东西 〈 尽 管 不 知道 是 哪个 数字 ! ) ， 而 且 我 们 可 以 把 这 两 个 袋 
子 与 世界 上 的 任何 其 他 袋子 做 比较 ， 来 看 看 跟 它们 是 不 是 有 着 同样 的 “ 数 ”。 


因此 描绘 数字 特征 的 一 种 方式 是 某 个 动作 的 重复 〈 或 者 叫 选 代 ) ， 在 这 个 例子 中 动作 是 从 
袋子 里 取 一 个 物体 。 每 一 个 数字 都 与 重复 一 个 动作 的 唯一 方式 对 应 : 数字 1 对 应 的 是 只 执 
行 这 个 动作 ， 数 字 2 对 应 的 是 执行 这 个 动作 然后 再 次 执行 ， 以 此 类 推 。 并 不 奇怪 ， 数 字 0 
对 应 着 根本 不 执行 这 个 动作 。 





























既然 创建 和 调用 proc 是 这 里 程序 唯一 可 以 执行 的 “动作 ”， 我 们 可 以 尝试 用 代码 实现 一 个 
数字 n， 在 代码 里 对 调用 proc 这 个 动作 重复 n 次 。 


























例如 ， 如 果 允 许 定义 方法 一 一 这 是 不 允许 的 ， 不 过 我 们 只 是 玩 一 玩 一 一 那么 我 们 可 以 把 
#one 定义 成 一 个 方法 ， 它 带 有 一 个 proc 参数 以 及 另 一 个 任意 的 参数 ， 而 且 它 会 用 该 任意 
参数 调用 proc: 





def one(proc, x) 
proc[x] 
end 

















我 们 还 可 以 定义 楷 wo， 它 会 调用 一 次 proc， 然 后 用 第 一 次 调用 的 结果 对 其 再 次 调用 :“ 





def two(proc, x) 


proc[proc[x]] 
end 


以 此 类 推 : 
def three(proc, x) 


proc[proc[proc[x]]] 
end 


按照 这 种 模式 ， 可 以 很 自然 地 把 #zero 定义 为 一 个 带 有 proc 和 男 一 个 参数 的 方法 ， 这 个 方 
法 完全 忽略 proc ( 换 句 话说 ， 对 其 调用 零 次 )， 并 且 会 原封 不 动 地 返回 第 二 个 参数 : 


注 4: 这 叫 作 “ 和 迭代 这 个 国 数 "。 

















154 | 第 6 章 


def zero(proc, x) 
x 
end 


所 有 这 些 实现 都 可 以 转换 成 无 方法 的 表示 。 例 如 ， 我 们 可 以 用 带 有 两 个 参数 ”的 proc 蔡 换 
方法 #one， 然 后 用 第 二 个 调用 参数 调用 第 一 个 参数 。 它 们 看 起 来 是 这 样 : 


ZERO = ->pt { x }} 
ONE =->p{->xt{ plx] }} 
THO =->p{->x{ plp[x]] }} 
THREE = -> p { -> x { plp[p[x]]] }} 


这 避免 了 不 允许 我 们 使 用 的 功能 ， 而 且 通 过 把 它们 赋值 给 常量 还 给 了 proc 名 字 。 


把 数据 表示 为 纯 代 码 的 技术 称 为 外 奇 编码 (Church encoding)， 它 是 以 

心 。lambda 演算 (http://dx.doi.org/10.2307/2371045) 的 发 明 者 阿 隆 佐 ' 邱 奇 的 名 

， 字 命名 的 。 这 些 数 字 是 印 奇 数 (Church numeral)， 而 且 我 们 很 快 将 会 看 到 部 
奇 布尔 值 (Church Boolean) 和 印 奇 有 序 对 〈Church pair) 的 例子 。 








尽管 在 FizzBuzz 解决 方案 里 我 们 回避 了 Ruby 的 特性 ， 但 是 一 旦 超出 了 我 们 的 代码 范围 
把 数字 的 这 些 外 部 表示 转换 成 Ruby 值 会 很 有 用 ， 这 样 它 们 就 能 在 控制 台 进 行 检 查 和 在 测 
试 中 断言 ， 或 者 至 少 能 让 我 们 相信 它们 确实 本 来 代表 数字 。 





幸运 的 是 ， 可 以 写 一 个 钠 o_integer 方法 执行 这 个 转换 : 


def to integer(proc) 
proc[-> n {n+1}][o] 
end 
这 个 方法 带 有 表示 一 个 数字 的 proc 并 用 另 一 个 proc 和 原始 的 Ruby 数字 0 来 调用 它 (这 个 
proc 只 是 递增 它 的 参数 )。 如 果 我 们 使 用 ZERO 调用 批 o_integer， 那 么 因为 ZERO 的 定义 ， 
递增 的 proc 不 会 得 到 调用 ， 这 样 我 们 会 原封 不 动 得 到 0: 





>> to_integer(ZERO) 
=> 0 


而 如 果 用 THREE 调用 失 o_integer， 递 增 的 proc 将 会 被 调用 三 次 ， 这 样 我 们 得 到 Ruby 的 3: 




















>> to_integer(THREE) 

=> 3 
因此 基于 proc 的 表示 只 是 在 对 数字 进行 编码 ， 并 且 我 们 可 以 根据 需要 把 它们 转 成 更 实用 的 
表示 。 














注 5: 实际 上 ,“ 带 有 两 个 参数 ”并 不 准确 ,因为 我 们 已 经 限制 自己 只 使 用 单 参数 的 proc 了 (参见 6.1.1 布 中 “ 参 
数 ” 部 分 )。 准 确 的 说 法 是 “ 带 有 一 个 参数 并 且 返 回 一 个 带 有 另 一 个 参数 的 新 的 proc” ,但 那 太 绕 嘴 了 ， 
所 以 我 们 采用 这 种 简略 的 说 法 ， 只 是 要 记 住 真正 的 意思 是 什么 。 
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对 于 FizzBuzz， 需 要 数字 5、15 和 100， 它 们 都 可 以 用 同样 的 技术 实现 ， 





FIVE = ->p{->x{ plplplp[lp[x]]]]] }} 

FIFTEEN = -> p { -> x { pp[p[p[p[pL[p[p[pLp[p[pLp[p[p[x]]]]]]]JII]II]I } } 

HUNDRED = -> p { -> x{p[p[p[p[p[p[p[p[p[p[pLp[p[pLp[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[ 
p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[p[pLp[p[p[p[p[p[p[p[pLp[p[p[p[p[p[ 
p[p[p[p[p[p[p[p[p[p[pL[p[p[p[p[p[p[p[p[pLp[p[p[p[x]]]]]]]]]]I]IIIIIIIIIIDIIIIIIIIDIJI 
1]1]]]]]]]]]]1]]]]]]]]] } } 





这 些 都 不 是 很 简洁 的 定义 ， 但 它们 确实 可 以 工作 ， 就 像 用 枇 o_integer 确认 的 那样 : 


>> to_integer(FIVE) 

=> 5 

>> to_integer(FIFTEEN) 
=> 15 

>> to_integer(HUNDRED) 
=> 100 


因此 ， 回 到 FizzBuzz 程序 ， 所 有 的 Ruby 数字 都 可 以 用 基于 proc 的 实现 替换 .: 





(ONE. .HUNDRED) .map do |nl 
if (n % FIFTEEN).zero? 
'FizzBuzz" 
elsif (n % THREE).zero? 
'Fizz' 
elsif (n % FIVE).zero? 
"Buzz" 
else 
n.to s 
end 
end 


地 aa， 


as | 我 们 写成 ONE 而 不 是 -> p { -> x { p[x] } } 等 ， 这 是 为 了 让 代码 更 清晰 。 


人 人 





遗憾 的 是 ， 这 个 程序 不 再 工作 了 ， 因 为 我 们 在 对 基于 proc 的 数字 实现 上 使 用 了 像 .. 和 % 这 
样 的 运算 符 。 因 为 不 知道 如 何 处 理 ， 所 以 Ruby 将 会 这 样 报错 : TypeError: can't iterate 
from Proc, NoMethodError: undefined method `%' for #<Proc (lambda)>。 为 了 使 用 这 些 表 
示 ， 我 们 需要 替换 掉 所 有 运算 ， 并 且 只 能 使 用 proc 完成 。 


但 是 在 我 们 能 重新 实现 任何 一 个 操作 之 前 ， 需 要 实现 true 和 false。 


6.1.4 布尔 值 
我 们 怎样 才能 只 用 proc 表示 布尔 值 呢 》 布尔 值 只 会 存在 于 条 件 语 名 当中， 而且 通 常情 况 
下 ， 一 个 条 件 会 说 “if 某 个 布尔 值 then 这 样 else 那样 ” 





























>> success = true 

=> true 

>> if success then 'happy' else 'sad' end 
=> "happy" 

>> success = false 

=> false 

>> if success then 'happy' else 'sad' end 
=> "sad" 








所 以 一 个 布尔 值 的 真正 工作 是 允许 在 两 个 选项 中 做 选择 ， 因 此 我 们 可 以 利用 这 一 点 ， 把 
布尔 值 表示 成 在 两 个 值 中 选择 其 一 的 proc。 我 们 不 是 把 一 个 布尔 值 看 成 一 段 无 生命 的 
代码 ， 它 被 将 来 的 代码 读 取 并 能 决定 选择 两 个 选项 中 的 哪 一 个 ， 而 只 是 直接 把 它 实 现 
为 一 段 代码 ， 这 段 代 码 在 用 两 个 选项 进行 调用 的 时 候 ， 要 么 选择 第 一 个 选项 要 么 选择 第 


sy 


PE o 























实现 成 方法 的 村 Yue 和 #false 可 能 是 : 


def true(x, y) 
x 
end 


def false(x, y) 


y 
end 


#true 是 一 个 带 有 两 个 参数 并 返回 第 一 个 参数 的 方法 ， 而 #alse 带 有 两 个 参数 并 返回 第 二 
个 。 这 足够 提供 给 我 们 粗 线条 的 条 件 行 为 了 : 











>> success = :true 

=> :true 

>> send(success, 'happy', 'sad') 
=> “happy” 

>> Success = :false 

=> :false 

>> send(success, 'happy', 'sad') 
=> "sad" 


像 以 前 一 样 直接 把 这 些 方法 转换 成 proc: 





TRUE = ->x{ -> 
三 > 


就 像 之 前 定义 了 批 o_integer 方法 作为 检查 ， 以 便 能 够 把 基于 proc 的 数字 转换 成 Ruby 数 
字 一 样 ， 我 们 可 以 定义 批 o_boolean 方法 ， 以 便 能 把 TRUE 和 FALSE 的 proc 转换 成 Ruby 原 
始 的 true 和 false 对 象 ， 





def to boolean(proc) 
pitoc[true][false] 
end 
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这 个 函数 带 有 一 个 表示 布尔 值 的 参数 ， 然 后 使 用 true 作为 第 一 个 参数 而 false 作为 第 二 个 


参数 调用 它 。TRUE 只 是 会 


而 FALSE 会 返回 false: 





>> to_boolean(TRUE) 
=> true 
>> to_boolean(FALSE) 
=> false 


返回 它 的 第 一 个 参数 ， 因 此 to_boolean (TRUE) 将 会 返回 true， 





因此 用 proc 表示 布尔 值 吕 


H 奇 地 简单 ， 但 对 于 FizzBuzz， 我 们 不 只 需要 布尔 值 ， 还 需要 用 


proc 实现 Ruby 的 if-elseif-else。 事 实 上 ， 由 于 这 些 布 尔 值 实现 的 工作 方式 ， 很 容易 写 


出 村 f 方法: 


def if(proc, x, y) 


proc[x][y] 
end 


而 这 很 容易 转换 成 一 个 proc: 


很 明显 IF 不 需要 做 什么 有 用 的 工作 ， 


加 的 糖 一 一 但 看 起 来 比 直 
IF[TRUE][ 'happy' ][ 
happy” 

IF[FALSE][ "happy "] 

'sad" 


这 还 意味 着 我 们 可 以 修改 


def to boolean(proc) 
IF[proc][true][fals 
end 





目 
和 让 





因为 布尔 值 自己 就 会 找到 合适 的 参数 一 一 IF 只 
接 调 用 布尔 值 更 自然 : 


'sad'] 








['sad'] 


#to_boolean 方法 以 使 用 IF: 


e] 


尽管 我 们 在 重 构 ， 但 值得 一 提 的 是 ， 像 6.1.1 节 中 “相等 ”部 分 讨论 的 那样 ，IF 的 实现 含 








有 与 更 简单 的 proc 等 价 的 proc， 所 以 IF 的 实现 能 被 显著 简化 。 例 如 看 一 下 IF 的 最 内 层 
实现 : 
-> y{ 
b[x][y] 
} 
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这 段 代码 的 意思 是 : 


(1) 带 上 一 个 参数 y; 
(2) 用 参数 x 调用 b 得 到 一 个 proc; 
(3) 用 参数 y 调用 这 个 proc。 





第 GD 步 和 第 (3) 步 没什么 用 ， 在 我 们 使 用 一 个 参数 调用 这 个 proc 的 时 候 ， 它 只 是 把 这 个 
参数 传 给 另 一 个 proc。 因 此 整个 proc 只 是 与 第 (2) 步 等 价 ， 也 就 是 b[x] ， 而 我 们 可 以 把 天 
用 的 代码 从 IF 的 实现 中 移 除 ， 以 便 让 它 更 简洁 : 





在 最 内 层 我 们 又 看 到 了 同样 的 模式 : 








-> x 
b[x 
} 


基于 同样 的 原因 ， 这 个 proc 与 b 相同 ， 因 此 我 们 可 以 进一步 简化 IF: 


{ 
] 





IF=->b{b} 
我 们 不 能 再 进一步 简化 了 。 


寺 。 








IF 没 做 什么 有 用 的 事情 (是 TRUE 和 FALSE 在 做 全 部 的 工作 )， 因 此 我 们 可 以 
心 。 去 掉 它 以 做 进一步 的 简化 。 但 我 们 的 目标 是 把 原始 的 FizzBuzz 程序 尽 可 能 忠 
DS 


…” 实地 转换 成 proc， 因 此 尽管 IF 仅仅 起 到 装饰 作用 ， 但 使 用 IF 提醒 我 们 if- 
elsif-else 表达 式 在 原始 程序 中 出 现 的 位 置 会 很 方便 。 








不 管 怎样 ， 现 在 有 了 IF， 可 以 回 到 FizzBuzz 程序 把 Ruby 的 if-elsif-else 杰 换 成 对 IF 的 
嵌 套 调用 了 : 


(ONE. .HUNDRED) .map do |n| 

IF[(n % FIFTEEN).zero?][ 
"FizzBuzz' 

][IF[(n % THREE).zero?][ 
'Fizz" 

][IF[(n % FIVE).zero?][ 
'Buzz" 

][ 
n.to_s 

]]] 


end 
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6.1.5 ”谓词 
我 们 下 一 步 的 工作 是 用 基于 proc 的 实现 替换 Fixnum#zero?， 这 个 实现 将 会 与 基于 proc 的 
数字 一 起 工作 。 处 理 Ruby 值 的 #zero? 的 基本 算法 像 下 面 这 样 : 


def zero?(n) 
if n == 0 
true 
else 
false 
end 
end 





(这 有 些 元 余 ， 但 它 明确 了 所 发 生 的 事情 : 把 这 个 数字 与 0 比较 ， 如 果 相 等 就 返回 true， 
否则 返回 false。) 





我 们 如 何 才能 让 它 处 理 proc 而 不 是 Ruby 数字 呢 ? 请 再 看 一 下 数字 的 实现 : 


ZERO 
ONE 
TWO 


{->x{ x }} 
{ ->x{ p[x] }} 
{ ->x{ }} 
THREE { - { }} 


和 
v vy v v 
OD™T5 














注意 ，ZERO 是 唯一 不 调用 p 的 数字 一 一 它 只 是 返回 x 一 一 但 所 有 其 他 的 数字 至 少 会 调用 p 
ws 我 们 可 以 利用 这 一 点 : 如 果 用 TRUE 信 罗 第 二 个 参数 图 用 “个 未 知 的 数字 ， 则 如 果 数 

是 ZER0， kh TRUE。 如 果 不 是 ZER0， 它 会 返回 调用 p 返回 的 东西 ， 因 此 如 果 我 
Ti p 成 为 一 个 总 是 返回 FLASE 的 proc， 就 会 得 到 想 要 的 行为 : 








def zero?(proc) 
proc[-> x { FALSE }][TRUE] 
end 


把 它 重 写 成 一 个 proc 还 是 很 容易 : 
IS ZERO = -> n { n[-> x { FALSE }][TRUE] } 

我 们 可 以 使 用 其 o_boolean 在 控制 台 上 检查 它 的 工作 情况 
>> to boolean(IS ZERO[ZERO]) 
=> true 


>> to_boolean(IS ZERO[THREE]) 
=> false 


这 工作 得 很 好 ， 所 以 在 FizzBuzz 里 ， 我 们 可 以 把 所 有 对 #zero? 的 调用 替换 成 IS_ZERO: 


(ONE. .HUNDRED) .map do |nl 
IF[IS_ZERO[n % FIFTEEN]][ 





"FizzBuzz” 
][IF[IS_ZERO[n % THREE]][ 
站 2 
J[IF[IS ZERO[n % FIVE]][ 
"Buzz 


][ 


n.to s 


]]] 


end 


6.1.6 有 序 对 
我 们 已 经 有 了 数字 和 布尔 值 形式 的 可 用 数据 ， 但 还 没有 能 有 条 理 地 存储 超过 一 个 值 的 任何 
数据 结构 。 为 了 实现 更 复杂 的 功能 ， 我 们 将 很 快 需要 某 种 数据 结构 ， 因 此 先 来 介绍 一 个 。 


最 简单 的 数据 结构 是 有 序 对 (pair)， 它 跟 二 元 数组 类 似 。 有 序 对 实现 起 来 非常 容易 : 





PAIR = ->x{->y{->f{ fx][y] }}} 
LEFT = ->p{pl->x{->y{x}}]} 
RIGHT = -> p {pl->x{->y{y}}]} 





一 个 有 序 对 的 作用 是 存储 两 个 值 ， 并 在 之 后 根据 需要 再 次 提供 。 为 了 构建 一 个 有 序 对 ， 我 
们 用 两 个 值 (一 个 x 和 一 个 y) 调用 PAIR， 然 后 返回 它 的 内 部 proc: 








-> f { f[lx][ly] } 


这 个 proc 在 用 另 一 个 为 f 的 proc 调用 时 ,会 用 较 早 的 x 和 y 的 值 作为 参数 回调 它 。LEFT 
和 RIGHT 会 从 一 个 有 序 对 中 分 别 选 出 左边 和 右边 的 元 素 ， 它 们 会 调用 一 个 proc， 这 个 proc 
分 别 返 回 其 第 一 个 和 第 二 个 参数 。 它 足够 简单 : 














>> my_pair = PAIR[THREE][FIVE] 
=> #<Proc (lambda)> 

>> to_integer(LEFT[my_pair]) 
=> 3 

>> to_integer(RIGHT[my_pair]) 
=> 5 


这 个 非常 简单 的 数据 结构 足够 我 们 使 用 了 ，6.1.8 节 中 将 使 用 有 序 对 ， 将 其 作为 更 复杂 结构 
的 一 个 基础 结构 。 

6.1.7 ”数值 运算 

现在 有 了 数字 、 布 尔 值 、 条 件 、 谓 词 以 及 有 序 对 ， 我 们 几乎 准备 好 重新 实现 模 运 算 符 了 。 


在 对 两 个 数 进行 模 运算 之 前 ， 我 们 需要 能 够 执行 更 简单 的 运算 ， 如 递增 和 递减 一 个 数 。 递 
增 相当 直接 : 
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INCREMENT = -> n { -> p{ ->x{fprn[p]j[x] } } } 


看 一 下 INCREMENT 如 何 工作 : 我 们 用 基于 proc 的 数字 n 调用 它 ， 它 会 返回 一 个 新 的 proc， 
这 个 proc 像 数 字 那 样 带 有 某 个 其 他 proc p 和 某 个 任意 的 第 二 参数 x。 











我 们 调用 这 个 新 的 proc 的 时 候 它 会 做 什么 呢 ? 首先 它 会 以 p 和 Xx 作为 参数 调用 rn 一 一 因为 
n 是 一 个 数字 ， 所 以 这 意味 着 就 像 原 始 的 数字 那样 ，“ 在 x 上 对 Pp 进行 n 次 调用 ”一 一 然后 
对 结果 再 调用 一 次 p。 那 么 总 体 说 来 ， 这 个 proc 的 第 一 个 参数 会 在 它 的 第 二 个 参数 上 调用 
n+1 次 ， 这 恰好 是 表示 数字 n+1 的 方法 。 








但 递减 呢 ?” 这 看 起 来 是 个 更 难 的 问题 : 一 旦 一 个 proc 已 经 调用 了 n 次 ， 再 额外 增加 一 次 调 
用 以 便 成 为 nt1 次 调用 是 相当 容易 的 ， 但 没有 明显 的 方法 可 以 撤销 一 次 调用 以 便 成 为 n-1 
次 调用 。 











一 个 解决 办 法 就 是 设计 一 个 proc， 在 对 某 个 初始 参数 调用 n 次 的 时 候 返 回 数字 n-1。 地 运 
的 是 ， 有 序 对 正好 可 以 帮助 我 们 实现 这 种 方法 。 思 考 一 下 这 个 Ruby 方法 所 做 的 : 





def slide(pair) 
[pair.last, pair.last + 1] 
end 


在 我 们 用 数字 组 成 的 二 元 数组 为 参数 调用 slide 时 ， 它 会 返回 一 个 新 的 二 元 数组 ， 这 个 二 
元 数组 包含 第 二 个 数字 还 有 比 第 二 个 数字 大 1 的 数字 ， 如 果 输 入 的 数组 包含 的 是 连续 数 
字 ， 那 么 效果 就 是 向 上 “滑动 ”一 个 数字 窗口 : 








>> slide([3, 4]) 
=> [4, 5] 
>> slide([8, 9]) 
=> [9，10] 


这 很 有 用 ， 因 为 通过 在 -1 处 开始 一 个 窗口 ， 我 们 可 以 安排 一 种 情况 ， 让 数组 里 的 第 一 个 
数字 比 我 们 调用 slide 的 次 数 小 1， 即 使 我 们 只 是 在 递增 数据 : 











>> slide([-1, 0]) 

=> [0， 1] 

>> slide(slide([-1, 0])) 

=> [1, 2] 

>> slide(slide(slide([-1, 0]))) 

=> [2， 3] 

>> slide(slide(slide(slide([-1, 0])))) 
= [3， 4] 


我 们 不 能 只 用 基于 proc 的 数字 完成 ， 因 为 没 法 表示 -1， 但 side 的 有 趣 之 处 是 不 管 怎样 
它 只 关注 数组 中 的 第 二 个 数 ， 因 此 我 们 可 以 放 入 任意 的 哑 值 (dummy value) 比如 说 
0 一 一 替换 掉 -1， 这 样 仍然 能 得 到 同样 的 结果 : 

















>> Slide([0，0]) 

=> [0，1] 

>> slide(slide([0, 0])) 

= | 也] 

>> Slide(slide(slide([0，0]))) 

=> [2， 3] 

>> slide(slide(slide(slide([0, 0])))) 
=> [3, 4] 





这 是 让 DECREMENT 工作 的 关键 : 我 们 可 以 把 slide 转 成 一 个 proc， 使 用 数字 n 的 proc 表示 对 


由 ZERO 组 成 的 有 序 对 调用 slide n 次 ， 然 后 使 用 LEFT 从 结果 的 有 序 对 中 拉 出 左边 的 数 来 : 
SLIDE = -> p { PAIR[RIGHT[p]][INCREMENT[RIGHT[p]]] } 
DECREMENT = -> n { LEFT[n[SLIDE][PAIR[ZERO][ZERO]]] } 

下 面 是 DECREMENT 的 作用 : 


>> to_integer(DECREMENT[FIVE]) 

to nec 
> to re eet Ee 
> | 

=> 0 


六 





DECREMENT[ZERO] 的 结果 实际 上 只 是 最 初 的 PAIR[ZERO][ZERO] 值 的 左边 元 素 ， 
心 。 在 这 种 情况 下 根本 就 没有 对 其 调用 过 SLIDE。 既 然 没 有 负 值 ，0 就 是 我 们 能 提 
和 全， 供给 DECREMENT[ZERO] 的 最 合理 的 答案 ， 因 此 使 用 0 作为 哑 值 是 个 好 主意 。 





























既然 我 们 有 了 INCREMENT 和 DECREMENT， 就 可 能 实现 类 似 加 法 、 减 法 、 乘 法 和 取 需 这 样 的 数 
字 运 算 了 : 


ADD =->m{ -> n { n[INCREMENT][m] } } 
SUBTRACT = -> m { -> n { n[DECREMENT][m] } } 
MULTIPLY = -> m { -> n { n[ADD[m]][ZERO] } } 
POWER = -> m{ ->n {nMULTIPLY[m]][ONE] } } 


这 些 实现 在 很 大 程度 上 是 自 解释 的 。 如 果 我 们 想 要 m 加 n， 只 需要 “从 nm 开 始 对 其 递增 n 
次 ”， 同 样 这 也 适用 于 减法 ， 有 了 ADD 之 后 ， 我 们 可 以 进行 m 乘 n， 方 法 是 “从 ZER0 开始 ， 
对 其 进行 n 次 ADD m”"， 使 用 MULTIPLY 和 ONE 进行 客运 算 也 类 似 。 














地 3 
在 6.2.2 节 “ 规 约 表 达 式 ”部 分 中 ， 我 们 将 用 Ruby 完成 ADD[ONE][ONE] 的 小 
人 4 、 步 求 值 ， 以 便 展示 它 如 何 产生 TW0。 


Um 


这 些 算数 足够 我 们 起 步 了 ,但 在 能 用 proc 实现 % 之 前 ， 我 们 需要 了 解 一 个 执行 模 运 算 的 
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算法 。 下 面 是 其 对 Ruby 数字 的 处 理 : 


def mod(m, n) 
if n <= m 
mod(m - n, n) 
else 
m 
end 
end 





例如 ， 为 了 计算 17 模 5 可 以 进行 如 下 操作 : 






































。 如 果 5 小 于 等 于 17， 这 是 事实 ， 那 么 就 用 17 减 去 5， 然 后 在 结果 上 调用 0d 方法， 也 


就 是 说 12 模 5; 


。 5 小 于 等 于 12， 因 此 尝试 7 模 5， 
。 5 小 于 等 于 7， 因 此 尝试 2 模 5; 






































。 5 不 再 小 于 等 于 2， 因 此 返回 结果 2。 








但 我 们 还 不 能 用 proc 实现 jmod， 因 为 它 使 用 了 另 一 个 运算 符 *=， 我 们 还 没有 实现 它 ， 因 





此 需要 和 暂时 先 用 proc 实现 <=。 





可 以 从 看 起 来 不 相干 的 对 Ruby 数 的 所 ess_or equal? 实现 开始 : 


def less or equal?(m, n) 
m-n<=0 
end 





这 没什么 用 ， 因 为 它 依赖 于 <=， 但 至 少 它 把 问题 分 解 成 了 两 个 我 们 已 经 解决 的 其 他 问题 
了 : 减法 和 与 零 作 比较 。 减 法 我 们 已 经 处 理 过 了 ， 与 零 的 相等 性 我 们 也 完成 了 ， 但 我 们 如 





何 实现 小 于 等 于 零 的 判断 呢 ? 


磁 巧 我 们 不 需要 担心 ， 因 为 零 已 经 是 我 们 知道 如 何 实现 的 最 小 的 数 了 。 回 忆 一 下 ， 我 们 基 
于 proc 的 数字 都 是 非 负 的 ， 因 此 “小 于 零 ” 在 我 们 的 数字 系统 里 是 无 意义 的 概念 


如 果 从 一 个 小 一 点 的 数 里 用 SUBSTRACT 减 去 一 个 大 一 点 的 数 ， 将 只 会 返回 ZER0， 因 为 没 法 
返回 一 个 负数 ， 并 且 ZERO 是 能 得 到 的 最 接近 的 值 了 ，: 

















>> to_integer(SUBTRACT[FIVE][THREE]) 


=> 2 


>> to_integer(SUBTRACT[THREE] [FIVE]) 


=> 0 


我 们 已 经 写 了 IS_ZER0， 并且 
SUBTRACT[m][n] 会 返回 ZERO， 








因为 如 果 m 小 于 等 于 n (也 就 是 说 n 至 少 与 m 一 样 大 ) 的 话 
所 以 足 可 以 用 proc 实现 所 ess_or_ equal? 了 : 








注 6: 你 可 能 会 抗议 3-5=0 不 叫 “ 减 法 "， 你 是 对 的 这 种 运算 的 专业 名 称 叫 “monus”， 因 为 加 法 之 下 的 非 
负 整 数 形成 的 是 可 交换 乏 半 群 而 不 是 一 个 合适 的 阿 贝 尔 群 。 


























def less or equal?(m, n) 
IS ZERO[SUBTRACT[m][n]] 
end 


让 我 们 把 这 个 方法 转 成 proc: 
IS_ LESS OR EQUAL = 
->m{->nf 


IS_ ZERO[SUBTRACT[m][n]] 
}} 


它 能 正常 工作 吗 ? 


>> to boolean(IS LESS OR EQUAL[ONE][TWO]) 


=> true 


>> to_boolean(IS_LESS OR_ EQUAL[TWo] [TWo]) 


=> true 


>> to boolean(IS LESS OR EQUAL[THREE][TWO]) 


=> false 


看 起 来 不 错 。 


这 补 上 了 #mod 实现 中 缺少 的 部 分 ， 因 此 可 以 用 proc 重 写 它 : 





def mod(m, n) 
IF[IS_LESS OR EQUAL[n][m]][ 
mod(SUBTRACT[m][n], n) 
1[ 


m 


] 


end 
并 用 一 个 proc 替换 掉 方法 定义 : 


MOD = 
->m{->nf 
IF[IS LESS OR EQUAL[n] 
MOD[SUBTRACT[m][n]][ 
][ 


m 


[m]][ 
n] 


}} 
太 好 了 ! 它 能 工作 吗 ? 


>> to_integer(MOD[THREE][TWO]) 


SystemStackError: stack level too deep 


Ruby 在 调用 MOD 的 时 候 进入 了 无 限 递 归 





循环 ， 





因为 我 们 把 Ruby 的 原始 功能 转换 成 proc 时 
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漏 掉 了 条 件 语义 中 一 些 重要 的 东西 。 在 像 Ruby 这 样 的 语言 里 ，if-else 语句 是 非 严格 的 
(或 者 说 是 懒 的 ) : 我 们 给 它 一 个 条 件 和 两 个 代码 块 ， 然 后 它 会 对 条 件 求 值 以 决定 对 哪个 代 
人 码 块 求 值 并 返回 一 一 它 从 来 也 不 会 对 两 个 代码 块 都 求 值 。 

IF 实现 的 问题 是 我 们 无 法 利用 构建 到 Ruby 的 if-else 里 的 懒 性 行为 。 我 们 只 能 说 “调用 


一 个 proc，IF， 甚 参数 是 两 个 其 他 的 proc”， 因 此 Ruby 冲 出 来 ， 在 IF 有 机 会 决定 返回 哪 
个 之 前 就 对 两 个 参数 都 进行 求 值 。 



































再 看 一 下 MOD. 


MOD = 
->m{->nf{ 
IF[IS LESS OR EOQOUAL[n][m]][ 
MOD[SUBTRACT[m][n]][n] 


m 


] 
}} 
在 我 们 对 m 和 n 调 用 MO0D， 而 Ruby 开 始 对 内 部 proc 的 代码 体 求 值 时 ， 它 会 对 
MOD[SUBTRACT[m][n]][n] 进行 递归 调用 并 立即 开始 把 它 当 作 传 递 给 IF 的 参数 求 值 ， 不 管 
IS_LESS OR EQUAL[n][m] 是 TRUE 还 是 FALSE。 对 MOD 第 二 次 调用 的 结果 是 又 一 次 无 条 件 的 
递归 调用 ， 以 此 类 推 ， 从 而 会 无 限 递归 下 去 。 


为 了 修正 ， 我 们 需要 一 种 方式 告诉 Ruby 延迟 对 IF 第 二 个 参数 的 求 值 ， 直 到 确定 需要 对 其 
求 值 为 止 。Ruby 中 任何 表达 式 的 求 值 都 可 以 通过 封装 到 一 个 proc 里 延迟 ， 但 在 一 个 proc 
内 封装 一 个 任意 的 Ruby 值 通常 会 改变 其 含义 (如 1+2 的 结果 并 不 等 于 ->{1+2})， 因 此 我 
们 可 能 需要 做 得 更 聪明 一 些 。 


吉 运 的 是 没 必 要 这 样 做 ， 因 为 这 是 一 个 特殊 情况 : 我 们 知道 因为 所 有 的 值 都 是 单 参 数 的 
proc， 所 以 调用 MOD 的 结果 也 将 会 是 一 个 单 参数 的 proc， 并 且 我 们 已 经 知道 〈 参 见 6.1.1 节 
中 “相等 ”部 分 )， 对 于 任意 的 proc p， 另 一 个 proc 将 其 封装 ， 它 与 p 参数 相同 并 立即 用 
此 参数 调用 p， 它 们 将 会 产生 同样 的 值 ， 因 此 我 们 可 以 使 用 这 个 技巧 延迟 递归 调用 而 不 影 
响 传递 给 IF 的 值 的 含义 : 
































MOD = 
->m{->nf{ 
IF[IS LESS OR EOQOUAL[n][m]][ 
->x{ 
MOD[ SUBTRACT[m] [n]][n][x] 





这 把 递归 的 MoD 调用 封装 到 -> x { .…:[x] } 以 对 其 延迟 。Ruby 现在 不 会 在 调用 IF 的 时 候 
试图 对 这 个 proc 的 代码 体 求 值 了 ， 但 如 果 这 个 proc 被 下 选中 并 作为 结果 返回 ， 它 就 能 被 
接受 者 调用 ， 最 终 触发 (现在 肯定 是 需要 的 ) 对 MOD 的 递归 调用 。 


MOD 现在 能 工作 吗 ? 









































>> to_integer(MOD[THREE][TWO]) 
=> 1 
>> to_integer(MOD[ 

POWER[ THREE] [THREE] 

[ 

ADD[ THREE] [TWO] 


=> 2 


是 的 ， 太 好 啦 ! 





但 是 先 别 庆祝 ， 因 为 还 有 一 个 更 环 手 的 问题 : 我们 在 用 常量 MOD 定义 常量 M0D， 因 此 这 个 定 
义 不 只 是 一 个 缩写 。 这 次 我 们 不 仅仅 在 把 一 个 复杂 的 proc 赋值 给 一 个 常量 以 便 之 后 重用 。 事 
实 上 ， 我 们 在 依赖 Ruby 的 赋值 语义 ， 尽 管 仍然 在 定义 MOD， 但 它 很 明显 还 没有 被 定义 ， 然 而 
我 们 可 以 在 MOD 的 实现 中 引用 它 ， 并 期 望 在 之 后 对 其 求 值 的 时 候 它 已 经 被 定义 了 。 











那 是 在 欺骗 ， 因 为 原则 上 我 们 应 该 能 撤销 掉 所 有 的 缩写 一 “我们 提 到 MoD 的 地 方 ， 实 际 
的 意思 是 这 个 长 长 的 proc” 但 只 要 MOD 由 其 自身 定义 这 就 不 可 能 。 




















我 们 可 以 使 用 Y 组 合子 解决 此 问题 ,这些 著名 的 辅助 代码 恰恰 是 为 此 目的 : 无 欺骗 地 定义 
一 个 递归 函数 。 下 面 是 它 的 样子 : 

Y= -> f{ -> x {flxx]] }-> x { f[x[x]] }] } 
三 言 两 语 很 难 解释 Y 组 合子 ， 但 下 面 是 一 个 梗概 (技术 上 不 准确 ) : 当 我 们 使 用 一 个 proc 
调用 立 组 合子 的 时 候 ， 它 会 用 proc 本 身 作 为 第 一 个 参数 对 proc 进行 调用 。 因 此 ， 如 果 我 
们 写 了 一 个 需要 一 个 参数 的 proc 并 用 那个 proc 调用 这 个 Y 组 合子 ， 那 么 这 个 proc 将 会 把 
自身 作为 参数 ， 从 而 只 要 它 想 要 调用 自身 的 时 候 就 可 以 使 用 那个 参数 。 















































悲剧 的 是 ， 由 于 和 MOD 永远 循环 一 样 的 原因 ，Y 组 合子 在 Ruby 中 也 会 永远 循环 下 去 ， 因 
此 我 们 需要 一 个 修订 后 的 版 本 。 是 表达 式 x[x] 引起 了 这 个 问题 ， 而 我 们 可 以 再 次 修正 这 
个 问题 ， 方 法 是 每 次 这 个 表达 式 出 现 ， 就 把 它 封 装 到 -> y { …:[y] } 内 部 以 延迟 它们 的 
求 值 : 


Z= -> f{->xt{ fl->y {xx[y] }] >xftfl>ytxxryy }] } 
乙 组 合子 ， 它 是 站 组 合子 对 于 像 Ruby 这 样 严格 语言 的 变换 。 


区 





日 
最 后 我 们 可 以 创建 MOD 的 一 个 满意 实现 了 ， 方 法 是 给 MOD 提供 一 个 额外 的 参数 f， 封 装 对 
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围绕 它 的 乙 组 合子 的 调用 ， 这 样 在 我 们 之 前 调用 MOD 的 地 方 都 可 以 调用 f: 





MOD = 
Z[-> f{->m{->nf 
IF[IS_LESS OR EQUAL[n][m]][ 
->x{ 
f[SUBTRACT[m][n]][n][x] 
} 
1[ 


m 
] 
}})] 
谢 天 谢 地 ，MoD 的 这 个 无 欺骗 的 版 本 仍然 能 工作 : 


>> to integer(MOD[THREE][TWO]) 

=> 1 

>> to_integer(MOD[ 
POWER[THREE] [THREE] 


1][ 
ADD[THREE] [Two] 
) 


=> 2 


现在 我 们 可 以 把 FizzBuzz 程序 中 % 出 现 的 地 方 都 赫 换 成 MOD 的 调用 : 


(ONE. .HUNDRED) .map do |n| 
IF[IS_ZERO[MOD[n][FIFTEEN]]][ 
"FizZzBuzz” 
][IF[IS_ZERO[MOD[n][THREE]]][ 
"Fizz" 
][IF[IS_ZERO[MOD[n][FIVE]]][ 
"Buzz" 


end 


6.1.8 列表 


对 于 FizzBuzz 我 们 只 遗留 了 几 个 Ruby 特性 要 重新 实现 : 范围 (range)、#map、 字 符 串 字 
耐量 以 及 Fixnum#to_s。 对 于 已 经 实现 的 值 和 运算 我 们 已 经 看 到 了 大 量 细节 ， 因 此 我 们 将 会 
快速 浏览 其 余 的 特性 并 尽 可 能 地 减少 细节 。( 不 要 担心 需要 理解 所 有 的 东西 ,我 们 只 是 浅 尝 
辑 止 。) 















































为 了 能 够 实现 范围 和 map， 我 们 需要 实现 列表 (list)， 而 构建 列表 的 最 简单 方法 就 是 使 用 
有 序 对 (pair)。 这 个 实现 像 链 表 一 样 工作 ， 其 中 每 个 有 序 对 都 保存 一 个 值 和 一 个 指向 链表 
中 下 一 个 有 序 对 的 指针 。 在 这 里 ， 我 们 不 使 用 指针 而 是 使 用 符 入 式 的 有 序 对 。 标 准 的 列表 
运算 看 起 来 是 这 样 : 




















EMPTY 
UNSHIFT 


PAIR[TRUE] [TRUE] 
->1{->x{ 
PAIR[FALSE][PAIR[x][1]] 
}} 

LEFT 

-> 1 { LEFT[RIGHT[1]] } 
-> 1 { RIGHT[RIGHT[1]] } 


Ll 


IS_EMPTY 
FIRST 
REST 


[| 上 


它们 像 这 样 工 作 : 





>> my_list = 
UNSHIFT[ 
UNSHIFT[ 
UNSHIFT[ EMPTY] [THREE] 
][Two] 
][ONE] 
=> #<Proc (lambda)> 
>> to_integer(FIRST[my_list]) 
=> 1 
>> to_integer(FIRST[REST[my_list]]) 
=> 2 
>> to integer(FIRST[REST[REST[my 1ist]]]) 
=> 3 
>> to_boolean(IS_ EMPTY[my_list]) 
=> false 
>> to_boolean(IS_ EMPTY[EMPTY]) 
=> true 








使 用 FIRST 和 REST 取出 列表 中 的 单个 元 素 相当 笨拙 ， 因 此 就 像 处 理 数字 和 布尔 值 那样 ， 我 





们 可 以 写 一 个 批 o_array 方法 以 便 在 控制 台 上 提供 帮助 : 


def to array(proc) 
array = [] 


until to boolean(IS EMPTY[proc]) 
array.push(FIRST[proc]) 
proc = REST[proc] 


end 
array 
end 
这 让 监视 列表 更 为 容易 : 


>> to array(my_list) 


=> [#<Proc (lambda)>, #<Proc (lambda)>, #<Proc (lambda)>] 


>> to array(my_list).map { |p| to _integer(p) } 
=> [1， 2， 3] 














如 何 实现 范围 呢 ? 事实 上 ， 与 其 找到 一 种 方式 显 式 地 把 范 

















围 表示 成 proc， 不 如 只 写 一 个 


proc， 它 可 以 构建 范围 内 的 所 有 元 素 的 列表 。 对 于 原始 的 Ruby 数字 和 “列表 ”( 如 数组 )， 











我 们 可 以 这 么 写 : 
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def range(m, n) 
if mx=n 
range(m + 1, n).unshift(m) 
else 
[] 
end 
end 








在 预期 可 用 的 列表 操作 方面 ， 这 个 算法 稍 嫌 做 作 ， 但 能 讲 得 通 : 由 m 到 n 所 有 数字 组 成 的 
列表 与 由 mt1 到 n 组 成 的 列表 〈 并 在 前 头 放 上 m) 一 样 ， 如 果 m 比 mn 大， 那 这 个 由 数字 组 成 
的 列表 就 是 空 的 。 


幸运 的 是 ， 我 们 已 经 有 了 把 这 个 方法 直接 转换 成 proc 所 需要 的 一 切 : 











RANGE = 
Z[-> ff{ 
->mf{f->nit 
IF[IS_ LESS_OR_EOUAL[m][n]][ 
->x{ 
UNSHIFT[f[INCREMENT[m]][n]][m][x] 














、 注意 乙 组 合子 对 递归 的 使 用 ， 以 及 条 件 语 名 的 TRUE 分 支 周 围 的 -> x { .…… 
全 


[ls 
4 


它 能 正常 工作 吗 ? 





>> my_range = RANGE[ONE][FIVEI] 

=> #<Proc (lambda)> 

>> to array(my_range).map { |p| to_integer(p) } 
[1, 2，3，4， 5] 


是 的 ， 可 以 正常 工作 ， 所 以 让 我 们 在 FizzBuzz 中 使 用 : 


RANGE[ONE][HUNDRED].map do |n| 
IF[IS_ZERO[MOD[n][FIFTEEN]]][ 
"FizZzBuzz” 
][IF[IS ZERO[MOD[n][THREE]]]I 
"Fizz” 
][IF[IS ZERO[MOD[n][FIVE]]][ 
"Buzz" 





为 了 实现 ap， 我 们 可 以 使 用 一 个 叫 FoLD 的 辅助 方法 ， 它 有 点 像 Ruby 中 的 Enumerable#inject: 





FOLD 令 写 出 能 处 理 列 表 中 每 一 项 元 素 的 proc 变 得 更 简单 : 


>> to_integer(FOLD[RANGE[ONE][FIVE]][ZERO][ADD]) 

=> 15 

>> to_integer(FOLD[RANGE[ONE][FIVE]][ONE][MULTIPLY]) 
=> 120 





一 旦 有 了 F0LD， 我 们 就 可 以 简洁 地 写 出 MAP 来 : 


MAP = 
->k{f->ft{ 
FOLD[k][EMPTY][ 
->1{ -> x { UNSHIFT[1][f[x]] } } 
] 
}} 


MAP 能 正常 工作 吗 ? 


>> my_list = MAP[RANGE[ONE][FIVE]][INCREMENT] 
=> #<Proc (lambda)> 

>> to array(my_list).map { |p| to integer(p) } 
=> [2; 3，4，25， 6] 


是 的 ， 可 以 正常 工作 。 因 此 我 们 可 以 替换 掉 FizzB 中 的 #map 了 : 


MAP[RANGE[ONE][HUNDRED]][-> n 
IF[IS_ZERO[MOD[n][FIFTEEN]]] 
"FizZzBuzz 
][IF[IS ZERO[MOD[n][THREE]]]I 
"Fizz" 
][IF[IS ZERO[MOD[n][FIVE]]][ 
"Buzz" 
1[ 
n.to_s 
]]] 
}] 


差不多 完成 了 ! 就 剩 下 处 理 字符 串 了 。 


{ 
[ 
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6.1.9 字符 串 


字符 串 很 容易 处 理 : 我 们 可 





哪个 字符 的 编码 达成 一 致 就 可 以 。 








以 只 是 把 它们 表示 成 由 数字 组 成 的 列表 ， 只 要 对 哪个 数字 表示 


我 们 可 以 选择 任何 编码 ， 因 此 不 使 用 像 ASCII 这 样 的 通用 目的 的 编码 ， 而 是 设计 一 种 对 于 
FizzBuzz 更 方便 的 新 型 编码 。 只 需要 对 数字 和 字符 串 'FizzBuzz'、'Fizz' 以 及 'Buzz' 进 
行 编码 就 可 以 ， 因 此 可 以 使 用 0 到 9 表示 字符 '0' 到 '9'， 而 把 字符 'B'、'F'、 


和 


这 档 














z' 编码 成 10 ~ 14。 





EF 我 们 就 有 了 一 种 方式 来 表示 需要 的 字符 串 字 面 量 (注意 不 要 截断 乙 组 合子 ) : 





TEN = MULTIPLY[TWO] [FIVE] 
B = TEN 


F = INCREMENT[B] 
I = INCREMENT[F] 
U = INCREMENT[I] 
ZED = INCREMENT[U] 
FIZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[EMPTY][ZED]][ZzED]][I]][F] 
BUZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[EMPTY][ZED]][ZzED]][uU]][B] 
FIZZBUZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[BUZZ][ZED]][ZED]][I]][F] 


和 


为 了 检查 其 是 否 能 正常 工作 ， 可 以 写 一些 外 部 的 方法 ， 把 它们 转换 成 Ruby 字符 串 : 


def to_char(c) 
"0123456789BFiuz' .Slice(to_integer(c)) 
end 


def to_string(s) 
to array(s).map { |c| to char(c) }.join 
end 


好 了 ， 字 符 串 能 工作 了 吗 ? 


>> to_char(ZED) 

> 

>> to_string(FIZZBUZZ) 
=> "FizzBuzz" 


大 好 啦 。 那 么 可 以 在 FizzBuzz 中 使 用 它们 了 : 


MAP[RANGE[ONE] [HUNDRED]][-> n 
IF[IS_ZERO[MOD[n][FIFTEEN]]][ 
FIZZBUZZ 
][IF[IS_ZzERO[MoD[n][THREE]]][ 
FIZZ 
][IF[IS ZERO[MOD[n][FIVE]]]I 
BUZZ 





最 后 要 实现 的 是 Fixnum#to_s。 为 此 ， 我 们 需要 能 把 数 分 割 成 组 成 它 的 数字 ， 下 面 是 一 种 
用 Ruby 实现 的 方法 : 


def to digits(n) 
previous _ digits = 
if nx 10 


[] 
else 

to digits(n / 10) 
end 


previous digits.push(n % 10) 


还 没有 实现 <， 但 可 以 通过 使 用 n<=9 而 不 是 nx 10 来 规避 这 个 问题 。 遗 憾 的 是 ， 我 们 没 法 
回避 实现 Fixnum#/ 和 Array#push， 下 面 是 它们 的 实现 : 
DIV = 


ZzZ[->f{->m{->nft{ 
IF[IS LESS OR EQUAL[n][m]][ 


->x{ 
INCREMENT[f[SUBTRACT[m] [n]][n]][x] 
} 
][ 
ZERO 
] 
二 训 
PUSH = 
->1{ 
->x{ 
FOLD[1] [UNSHIFT[EMPTY] [x] ] [UNSHIFT] 
} 


现在 可 以 把 批 o_digits 转换 成 一 个 proc 了 : 
TO DIGCITS = 
ZzZ[-> f { -> n { PUSH[ 


IF[IS LESS OR EQUAL[n][DECREMENT[TEN]]]I 
EMPTY 


] 
][MOD[n][TEN]] } }] 


它 能 工作 吗 ? 
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>> to array(TO DIGITS[FIVE]).map { |p| to integer(p) } 

=> [5] 

>> to _array(TO_DIGITS[POWER[FIVE][THREE]]).map { |p| to integer(p) } 
=> [区 本 2， 5] 














是 的 ， 可 以 工作 。 而 且 因为 我 们 已 经 预见 性 地 设计 了 一 种 字符 串 编码 ， 在 这 种 字符 串 编 码 
里 ，1 代表 '1 ， 以 此 类 推 ， 所 以 由 T0_DIGITS 产生 的 数组 已 经 是 有 效 的 字符 串 了 : 








>> to_string(TO_DIGITS[FIVE]) 

yr 

> to_string(TO_DIGITS[POWER[FIVE][THREE]]) 
oe 


因此 我 们 可 以 在 FizzBuzz 中 用 TO0_DIGITS 替换 楷 0_s: 


MAP[RANGE[ONE] [HUNDRED]][-> n 
IF[IS_ZERO[MOD[n][FIFTEEN]]][ 
FIZZBUZZ 
][IF[IS ZERO[MOD[n][THREE]]]I 
FIZZ 
][IF[IS_zERO[MoD[n][FIVE]]][ 
BUZZ 


[ 
TO_DIGITS[n] 
]]] 
}] 


6.1.10 ”解决 方案 
我 们 最 终 完成 了 ! (这 可 能 是 有 史 以 来 最 长 的 、 最 策 拙 的 工作 面试 了 。) 现在 我 们 已 经 有 
了 完全 由 proc 写成 的 FizzBuzz 的 实现 。 来 运行 一 下 以 确保 它 正常 工作 : 


>> solution = 
MAP[RANGE[ONE] [HUNDRED]][-> n { 
IF[IS_ZERO[MOD[n][FIFTEEN]]][ 
FIZZBUZZ 
][IF[IS_ZERO[MOD[n] [THREE]]][ 
FIZZ 


][IF[IS_ZzERO[MoD[n][FIVE]]][ 
BUZZ 


[ 
TO_DIGITS[n] 
]]] 


=> #<Proc (lambda)> 
>> to array(solution).each do |p| 
puts to string(p) 
end; nil 





经 历 了 这 
这 么 多 麻 
不 烦 以 确 
保 每 一 个 
个 和 常量 
常量 只 是 某 个 更 长 表 
达 式 的 一 个 
个 缩写 
， 我 们 认 》 
为 有 必 
必要 把 


每 一 个 常 
个 常量 用 马 
已 的 定义 在 
链 换 ， 因 此 可 以 看 到 
完整 的 程 
序 了 : 
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级 编程 技术 


构建 完全 由 序 需 要 很 多 努力 ， 但 我 们 已 经 明白 只 要 不 介意 
proc 组 成 的 程 
roc 组 成 的 程序 需要 很 多 ， 但 我 们 已 经 明白 
已 到 2 \ 介 意 应 用 
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太 


1. 无 限 流 

使 用 代码 表示 数据 有 一 些 有 趣 的 优点 。 我 们 基于 proc 的 列表 不 一 定 是 静态 的 : 列表 也 是 代 
码 ， 在 我 们 传递 它 给 FIRST 和 REST 时 它 能 做 正确 的 事情 ， 因 此 很 容易 实现 能 动态 计算 自身 
内 容 的 列表 ， 也 就 是 流 (stream)。 事 实 上 ， 流 没有 理由 是 有 限 的 ， 因 为 计算 只 需要 根据 需 
要 生成 列表 的 内 容 就 可 以 了 ， 所 以 它 可 以 一 直 无 限 产 生 新 的 值 。 


例如 ， 下 面 是 一 个 零 组 成 的 无 限 流 的 实现 : 


ZEROS = Z[-> f { UNSHIFT[f][ZERO] }] 



































中 这 是 ZER0S = UNSHIFT[ZEROS][ZERO] 的 “无 欺骗 ”版 本 ， 即 用 它 自身 定义 的 
心 。 数 据 结构 。 作 为 一 个 程序 员 ， 我 们 通常 会 觉得 用 自身 定义 一 个 递归 国 数 的 思 
人 


~ 想 很 舒服 ， 但 用 自身 定义 一 个 数据 结构 看 起 来 很 怪异 ， 在 这 种 情况 下 ， 它 们 
几乎 是 同样 的 东西 ， 而 乙 组 合子 让 两 者 都 完全 合理 了 。 


在 控制 台 上 ， 我 们 可 以 看 到 ZER0S 表现 得 就 像 一 个 列表 ， 尽 管 这 个 列表 看 不 到 尽头 : 





























>> to_integer(FIRST[ZEROS]) 

=> 0 

>> to_integer(FIRST[REST[ZEROS]]) 

=> 0 

>> to integer(FIRST[REST[REST[REST[REST[REST[ZEROS]]]]]]) 
=> 0 


能 有 一 个 辅助 方法 把 这 个 流转 成 一 个 Ruby 的 数组 会 很 方便 ， 但 to_array 会 永远 运行 下 
去 ， 直 到 我 们 明确 地 让 这 个 转换 进程 停 下 来 为 止 。 一 个 可 选 的 “最 大 数 ” 的 参数 可 以 做 
到 这 一 点 : 


def to array(l1, count = nil) 
array = [] 


until to boolean(IS EMPTY[1]) || count == 
array.push(FIRST[1]) 


1 = REST[1] 
count = count - 1 unless count.nil? 
end 
array 
end 


这 让 我 们 可 以 从 流 中 获取 任意 数目 的 元 素 并 把 它们 转 成 一 个 数组 : 


>> to array(ZEROS, 5).map { |p| to integer(p) } 

=> [0, 0, 0, 0, 0] 

>> to _array(ZEROS, 10).map { |p| to integer(p) } 

say [0, 05 .0,05. 0, 05. 0, 0;. 0;: 0] 

>> to _array(ZEROS, 20).map { |p| to _integer(p) } 

ay 05 O05 ©, 0 O05 0, O05 O05 O05 0 O05 0 0 005 0] 
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ZEROS 不 会 每 次 都 对 一 个 新 的 元 素 进 行 计算 ， 但 做 起 来 也 非常 简单 。 下 面 是 一 个 从 给 定 值 
累加 的 流 : 











>> UPWARDS OF = Z[-> f { -> n { UNSHIFT[-> x { f[INCREMENT[n]][x] }][n] } }] 

=> #<Proc (lambda)> 

>> to_array(UPWARDS_OF[ZERO], 5).map { |p| to_integer(p) } 

三 [0， 1，2，3， 4] 

>> to array(UPWARDS OF[FIFTEEN], 20).map { |p| to_integer(p) } 

=> [15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,33，34] 











掉 是 一 个 包含 一 个 给 定数 字 所 有 倍数 的 流 : 





>> MULTIPLES_OF = 
-> mi 
Z[-> f{ 
-> n { UNSHIFT[-> x { fr[ADD[m][n]][x] }][n] } 
}][m] 


=> #<Proc (lambda)> 

>> to _array(MULTIPLES OF[TWO], 10).map { |p| to integer(p) } 

s% [2 4 :0s Bs -105° 12, 1d; 1465 18,20] 

>> to_array(MULTIPLES OF[FIVE], 20).map { |p| to integer(p) } 

=> [5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90,95,，100] 


我 们 可 以 像 其 他 列表 一 样 操纵 这 些 无 限 流 。 例 如 ， 可 以 通过 对 已 有 的 proc 映射 一 个 新 的 


proc 得 到 一 个 新 的 流 : 





>> to _array(MULTIPLES OF[THREE], 10).map { |p| to integer(p) } 

=> [3, 6, 9, 12, 15, 18, 21, 24, 27,，30] 

>> to _array(MAP[MULTIPLES OF[THREE]][INCREMENT], 10).map { |p| to integer(p) } 

a [4y, 75 105 13, 16; 19; 227 255 28; 31] 

>> to_array(MAP[MULTIPLES OF[THREE]][MULTIPLY[TWO]], 10).map { |p| to integer(p) } 
=> [6， 12，18，24，30，36，42，48，54， 60] 


甚至 可 以 写 一 个 proc 把 两 个 流 组 合成 第 三 个 流 : 


>> MULTIPLY_STREAMS = 
Z[-> f{ 
->k{->1t1{ 
UNSHIFT[-> x { f[REST[k]][REST[1]][x] }][MULTIPLY[FIRST[k]][FIRST[1]]] 
} } 


}] 

=> #<Proc (lambda)> 

>> to array(MULTIPLY_ STREAMS[UPWARDS OF[ONE]][MULTIPLES OF[THREE]], 10). 
map { |p| to integer(p) } 

=> [3, 12, 27, 48, 75, 108, 147, 192, 243,，300] 


因为 流 的 内 容 能 由 任何 计算 生成 ， 所 以 我 们 创建 斐 波 那 契 数列 的 无 限 列 表 ， 或 者 质数 ， 或 
者 按 字母 顺序 的 所 有 可 能 的 字符 串 ， 或 者 任何 其 他 可 计算 的 东西 都 已 经 没有 障碍 了 。 这 个 
抽象 非常 强大 ， 除 了 已 有 的 特性 乙 外 不 需要 任何 智能 的 特性 了 。 





























原始 Ruby 流 


Ruby 有 一 个 Enumerator 类 可 以 用 来 构建 无 限 的 流 ， 而 不 需要 依赖 proc。 下 面 是 “给 
定数 的 倍数 ”的 流 的 实现 方法 : 


def multiples_of(n) 
Enumerator.new do |yielder | 
value = n 
loop do 
yielder.yield(value) 
value = value + nN 
end 
end 
end 


这 个 方法 返回 一 个 Enumerator， 每 次 我 们 对 其 调用 #next， 它 都 会 执行 loop 的 一 个 选 
代 并 返回 获得 的 值 : 

>> multiples_of three = multiples_of(3) 

=> #<Enumerator: #<Enumerator::Generator>:each> 

>> multiples_of three.next 

=> 3 

>> multiples of three.next 

=> 6 

>> multiples_of three.next 

=> 9 
Enumerator 类 包括 了 Enumerable 模块 ， 此 我 们 可 以 调用 #first、#take 和 #detect 
这 样 的 方法 : 

>> multiples_of(3).first 

=> 3 

>> multiples of(3).take(10) 

= [3 6. 9, 12 15 18, 210 245. 273 30] 

>> multiples of(3).detect { |x| x > 100 } 

=> 102 
其 他 的 Enumerable 方法 ， 如 jap 和 #select， 在 这 个 Enumerator 上 没 法 正常 工作 ， 因 
为 它们 会 尝试 处 理 这 个 无 限 流 中 的 每 一 项 。 但 是 ，Ruby 2.0 的 Enumerator::Lazy 类 重 
新 实现 了 一 些 Enumerable 方法 ， 这 样 它们 在 依赖 的 Enumerator 继续 计数 时 仍然 可 以 工 
作 。 我 们 可 以 通过 在 一 个 Enumerator 上 调用 #1azy 来 获得 一 个 Enumerator::Lazy， 然 
后 可 以 像 之 前 操纵 proc 版 本 一 样 操 纵 这 些 无 限 流 : 

>> multiples_of(3).1azy.map { |x| x * 2 }.take(10).force 

=> [6, 12, 18, 24, 30, 36, 42, 48, 54, 60] 

>> multiples of(3).lazy.map { |x| x * 2 }.select { |x| x > 100 }.take(10).force 

=> [102，108，114，120，126，132，138，144，150，156] 

>> multiples of(3).1lazy.zip(multiples of(4)).map { |a, b| a * b }.take(10).force 

=> [12，48，108，192，300，432，588，768，972，1200] 
与 基于 proc 的 列表 相 比 ， 这 不 是 很 整洁 (为 了 处 理 无 限 流 ， 我 们 得 写 一 些 特殊 的 代 
码 ， 而 不 能 只 是 像 通 常 的 Enumerable 那样 处 理 ) ， 但 它 表明 Ruby 确实 含有 处 理 这 些 不 
寻常 数据 结构 的 内 建 方式 。 
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2. 避免 随意 递归 

在 FizzBuzz 练习 里 ， 我 们 使 用 MOD 和 RANGE 这 样 的 递归 国 数 展示 了 乙 组 合子 的 用 法 。 这 很 
方便 ， 因 为 它 让 我 们 从 一 个 没有 约束 的 递归 的 Ruby 实现 转换 成 一 个 基于 proc 的 实现 ， 而 
不 必 改 变 代码 结构 ， 但 是 从 技术 上 讲 ， 没 有 乙 组 合子 我 们 也 可 以 利用 印 奇 数 的 行为 来 实现 








例如 ，MoD[m][n] 的 实现 方法 是 ， 只 要 n<=m 就 不 断 地 从 m 中 减 去 n， 并 且 总 是 检查 这 个 条 
件 以 决定 是 否 进行 下 一 次 的 递归 调用 。 但 如 果 只 是 对 “如 果 n “= 就 从 m 中 减 去 mn” 这 
个 动作 执行 固定 的 次 数 ， 而 不 是 使 用 递归 动态 控制 这 个 重复 的 过 程 ， 也 可 以 得 到 同样 的 结 
果 。 我 们 不 知道 需要 重复 的 确切 次 数 ， 但 知道 m 次 肯定 够 了 (最 差 情 况 就 是 n 为 1) ， 而 且 
多 做 几 次 也 无 得: 





def decrease(m, n) 
if n <= m 
m - n 
else 
m 
end 
end 


>> decrease(17, 5) 

=> 12 

>> decrease(decrease(17, 5), 5) 

=> 7 

>> decrease(decrease(decrease(17, 5), 5), 5) 

=> 2 

>> decrease(decrease(decrease(decrease(17, 5), 5), 5), 5) 

=> 2 

>> decrease(decrease(decrease(decrease(decrease(17, 5), 5), 5), 5), 5) 
=> 2 





因此 我 们 可 以 重 写 MOD 以 利用 一 个 proc， 这 个 proc 的 参数 是 一 个 数 ， 它 或 是 从 这 个 数 中 减 
去 m (如 果 它 比 n 大 ) 或 是 直接 返回 这 个 数 。 这 个 proc 对 mm 本身 调用 m 次 ， 以 便 获 得 最 终 
的 答案 : 





MOD = 
->m{->nf{ 
m[->x{ 
IF[IS LESS OR EQUAL[n][x]][ 
SUBTRACT[x] [n] 








>> to_integer(MOD[THREE][TWO]) 

=> 1 

>> to_integer(MOD[ 
POWER[THREE] [THREE] 


[ 
ADD[THREE][TWO] 


=> 2 


尽管 这 个 实现 比 原来 的 实现 简单 ， 但 它 不 仅 难 以 阅读 而 且 通 常 效 率 更 低 ， 因 为 它 总 是 会 执 
行 重复 调用 的 最 差 情况 下 的 次 数 而 不 是 尽 可 能 早 地 停 下 来 。 在 外 延 上 它 也 与 原来 的 实现 
不 等 价 ， 因 为 老 版 本 的 MOD 如 果 被 要 求 除 零 的 话 会 永远 循环 下 去 〈 条 件 n<=m 永远 不 会 为 
false) ， 而 这 个 实现 只 是 返回 它 的 第 一 个 参数 : 


>> to_integer(MOD[THREE][ZERO]) 
s>: 3 


RANGE 更 有 挑战 一 些 ， 但 我 们 可 以 使 用 与 让 DECREMENT 工作 时 类 似 的 技巧 :设计 一 个 函数 ， 
在 对 某 个 初始 参数 调用 n 次 时 ， 它 会 从 预想 的 范围 里 返回 mn 个 数 的 列表 。 就 像 DECREMENT 
一 样 ， 秘 诀 是 使 用 一 个 有 序 对 存储 结果 的 列表 和 在 下 一 个 迭代 中 需要 的 信息 : 





def countdown(pair) 
[pair.first.unshift(pair.last), pair.last - 1] 
end 


>> countdown([[]，10]) 

=> [[10], 9] 

>> countdown(countdown([[], 10])) 

=> [[9， 10]， 8] 

>> countdown(countdown(countdown([[], 10]))) 

=> [[8， 9， 10]， 7] 

>> countdown(countdown(countdown(countdown([[]，10])))) 
=> [[7， 8，9， 10]， 6] 


重 写 proc 很 容易 : 


COUNTDOWN = -> p { PAIR[UNSHIFT[LEFT[p]][RIGHT[p]]][DECREMENT[RIGHT[p]]] } 





现在 我 们 只 需要 实现 RANGE 以 便 它 调用 COUNTDOWN 正确 的 次 数 (从 m 到 n 的 范围 内 总 是 有 
m-n+1 个 元 素 ) 并 从 最 终 的 有 序 对 中 取出 结果 列表 : 


RANGE = -> m { -> n { LEFT[INCREMENT[SUBTRACT[n][m]][COUNTDOWN][PAIR[EMPTY][n]]] } } 














这 个 无 组 合子 的 版 本 工作 得 也 很 好 : 


>> to array(RANGE[FIVE][TEN]).map { |p| to integer(p) } 
=> [5, 6, 7, 8, 9, 10] 





从 零 开始 编程 | 183 








可 以 通过 执行 事先 决定 好 次 数 的 迭代 来 实现 MOD 和 RANGE 一 一 而 不 是 执行 一 
4 4 、 个 会 一 直 运 行 直到 条 件 变 为 true 才 停止 的 任意 的 循环 一 一 因为 它们 是 原始 道 
4 二， 三 函数 。 参 见 7.2 节 可 以 了 解 更 多 内 容 。 



































6.2 ”实现 lambda 演 算 


FizzBuzz 实现 已 经 让 我 们 对 用 无 类 型 的 lambda 演算 写 程序 有 了 一 些 感觉 。 这 些 限制 迫使 
我 们 从 零 开 始 实现 大 量 的 基本 功能 而 不 是 依赖 语言 的 特性 ， 但 我 们 确实 成 功 构 建 了 解决 这 
个 问题 所 需要 的 数据 结构 和 算法 。 


因为 还 没有 lambda 演算 的 解释 器 ， 所 以 还 没有 真正 写 演算 的 程序 呢 。 我 们 只 是 在 用 
lambda 演算 的 形式 写 Ruby 程序 ， 以 此 获得 这 样 一 个 小 语言 能 工作 的 感觉 。 但 我 们 已 经 有 
了 构建 lambda 演算 解释 器 并 用 其 对 实际 的 lambda 演算 表达 式 求 值 的 所 有 知识 ， 那 来 尝试 
一 下 吧 。 














6.2.1 语法 

无 类 型 的 lambda 表达 式 是 一 种 编程 语言 ， 它 只 有 三 种 表达 式 : 变量 、 函 数 定义 以 及 调用 。 
我 们 不 再 引入 一 种 新 的 lambda 表达 式 语 法 ， 而 是 还 遵守 Ruby 的 习惯 (变量 看 起 来 像 x， 
国 数 看 起 来 像 ->x{x}， 而 调用 看 起 来 像 是 x[y]) ， 并 尽量 不 让 两 种 语言 混 靖 。 























峙 全 











为 什么 是 “lambda 演算 ”? 

4 

YY 说 人 > >、 一 | ww [= Wr 

依 在 这 个 上 下 文中 , 单词 演算 (caleulus) 的 意思 是 一 个 操纵 符号 字符 串 的 规则 
系统 。 lambda 演算 的 原始 语法 用 的 是 希腊 字母 Jambda ( 》 ) 代替 Ruby 中 的 
-> 符号 。 例 如，ONE 会 写成 和 p. 入 Xx.p Xx。 














我 们 可 以 用 常见 的 方式 实现 LCVariable、LCFunction 和 LCCall 类 : 


class LCVariable < Struct.new(:name) 
def to_s 
name .to_Ss 
end 


def inspect 
tos 
end 
end 


class LCFunction < Struct.new(:parameter, :body) 
def to_s 





注 7: 大 多 数 人 把 它 与 微 积 分 学 联系 起 来 ， 这 是 一 个 数学 函数 中 关于 改变 率 和 数量 累加 率 的 系统 。 
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"-> #{parameter} { #{body} }" 
end 


def inspect 
to s 
end 
end 


class LCCall < Struct.new(:left, :right) 
def to_s 
"#{left}[#{right}]" 
end 


def inspect 
to s 
end 
end 


这 些 类 可 以 让 我 们 构建 lambda 演算 表达 式 的 抽象 语法 树 ， 就 像 第 2 章 的 Simple 和 第 3 章 
的 正则 表达 式 那 样 : 


>> one = 
LCFunction.new(:p， 
LCFunction.new(:X， 
LCCall.new(LCVariable.new(:p), LCVariable.new(:x)) 


) 
) 
=> ->p{->x{ plx]}} 


>> increment = 
LCFunction.new(:n, 
LCFunction.new(:p， 
LCFunction.new(:X， 
LCCall.new( 
LCVariable.new(:p), 
LCCall .new( 
LCCall.new(LCVariable.new(:n), LCVariable.new(:p)), 
LCVariable.new( :x) 
) 
) 
) 
) 
) 
=> -> n{ -> p{ -> x{ pntp][x]] }}} 
>> add = 
LCFunction.new(:m, 
LCFunction.new(:n, 
LCCall.new(LCCall .new(LCVariable.new(:n), increment), LCVariable.new(:m)) 
) 
) 
=> ->m{->n{n->n{->p{->x{p[lnlpj[x]] } } }[m] }} 


因为 这 种 语言 有 这 样 小 的 语法 ， 所 以 那 三 个 类 足以 表示 任意 的 lambda 演算 的 程序 了 。 
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6.2.2 语义 

现在 通过 为 每 个 语法 类 实现 一 个 #feduce 方法 来 为 lambda 演算 赋予 一 个 小 步 操作 语义 。 小 
步 操作 语义 是 一 个 很 有 吸引 力 的 选择 ， 因 为 它 能 让 我 们 看 到 求 值 的 每 一 步 ， 这 在 Ruby 表 
达 式 中 是 没 法 轻易 做 到 的 。 


1. 替换 变量 
在 实现 #reduce 之 前 ， 我 们 需要 另 一 个 叫 作 #replace 的 操作 ， 它 能 找到 一 个 表达 式 里 的 一 
个 特定 变量 并 用 另 一 个 表达 式 替换 它 : 





class LCVariable 
def replace(name, replacement) 
if self.name == name 
replacement 
else 
self 
end 
end 
end 


class LCFunction 
def replace(name, replacement) 
if parameter == name 
self 
else 
LCFunction.new(parameter, body.replace(name, replacement)) 
end 
end 
end 


class LCCall 
def replace(name, replacement) 
LCCall.new(left.replace(name, replacement), right.replace(name, replacement)) 
end 
end 


对 于 变量 和 调用 ， 它 的 工作 方式 很 明显 : 





>> expression = LCVariable.new(:x) 
=> Xx 
>> expression.replace(:x, LCFunction.new(:y, LCVariable.new(:y))) 
=> ->y{y} 
>> expression.replace(:z, LCFunction.new(:y, LCVariable.new(:y))) 
= Xx 
>> expression = 
LCCall.new( 
LCCall.new( 
LCCall.new( 
LCVariable.new(:a), 
LCVariable.new(:b) 
)， 





LCVariable.new(:c) 
)， 
LCVariable.new(:b) 


) 
=> a[b][cj[b] 
>> expression.replace(:a, LCVariable.new(:x)) 
=> x[b][c][b] 
>> expression.replace(:b, LCFunction.new(:x, LCVariable.new(:x))) 


=> a[-> x { x }][cl[->x {x}] 


对 于 函数 ， 情 况 会 更 复杂 。#replace 只 能 对 一 个 函数 的 函数 体 起 作用 ， 而 且 它 只 能 替换 自 
由 变量 一 一 自由 变量 就 是 在 函数 范围 内 但 是 没有 被 声明 为 函数 参数 的 变量 : 


>> expression = 
LCFunction.new(:y， 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 


) 
=> -> y { x[y] } 
>> expression.replace(:x, LCVariable.new(:z)) 
=> -> y { z[y] } 
>> expression.replace(:y, LCVariable.new(:z)) 
=> -> y { x[y] } 


这 让 我 们 可 以 替换 掉 整 个 表达 式 中 的 同一 个 变量 ， 而 不 会 不 小 心 改变 正好 有 相同 名 字 的 无 关 








注册 
甩 





>> expression = 
LCCall.new( 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)), 
LCFunction.new(:y, LCCall.new(LCVariable.new(:y), LCVariable.new(:x))) 


) 
=> x[y][-> y { y[x] }] 


>> expression.replace(:x, LCVariable.new(:z)) 


=> zlyll->y {ylz] }] @ 


>> expression.replace(:y, LCVariable.new(:z)) 


=> x[z][->y {ylx] }] @ 
@ 在 原始 表达 式 中 x 都 是 自由 的 ， 所 以 它们 都 被 替换 掉 了 。 


只 有 第 一 次 出 现 的 y 才 是 自由 变量 ， 因 此 只 有 它 被 替换 掉 了 。 第 二 个 y 是 个 国 数 参数 ， 
不 是 变量 ， 而 第 三 个 y 是 一 个 属于 那个 函数 的 变量 ， 所 以 不 应 该 碰 它 。 

















简单 的 拉 eplace 实现 在 革 些 输入 下 不 能 工作 。 它 无 法 正确 地 处 理 含有 自由 变 
一 E> 量 的 标 换 ， 


>> expression = 
LCFunction.new(:X， 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 











=> -> x { x[y] } 
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>> replacement = LCCall.new(LCVariable.new(:z), LCVariable.new(:x)) 

=》 ZX] 

>> expression.replace(:y, replacement) 

=> -> x{ x[z[x]] } 
像 那样 只 是 把 z[x] 粘贴 进 -> x { ..。. } 的 函数 体内 是 不 行 的 ， 因 为 z[x] 中 
的 x 是 一 个 自由 变量 ， 在 处 理 完 之 后 应 该 保持 不 变 ， 但 在 这 里 ， 它 恰好 被 同 
名 的 函数 参数 捕获 了 。* 









































我 们 可 以 忽略 这 个 缺陷 ， 因 为 我 们 将 只 对 不 含 任何 自由 变量 的 表达 式 求 值 ， 
因此 实际 上 它 不 会 产生 任何 问题 ， 但 是 要 注意 ， 一 般 情 况 下 ， 需 要 一 种 更 为 
复杂 的 实现 。 




















2. 调用 函数 

方法 #feplace 的 作用 就 是 给 我 们 一 种 实现 函数 调用 语义 的 方式 。 在 Ruby 中 ， 在 用 一 个 或 
者 多 个 参数 调用 proc 的 时 候 ，proc 的 主体 会 得 到 求 值 ， 在 这 个 环境 下 每 个 参数 都 被 赋值 给 
了 一 个 本 地 变量 ， 因 此 每 次 使 用 变量 时 都 像 用 参数 本 身 一 样 。 这 上 暗示 着 ， 用 参数 1 和 ?2 调 
用 proc->x，y {x + y} 会 产生 中 间 表 达 式 1+2， 它 是 为 了 产生 最 终结 果 所 要 求 值 的 表达 式 。 











在 lambda 演算 中 我 们 可 以 应 用 同样 的 思想 ， 在 对 一 个 调用 求 值 的 时 候 赫 换 一 个 函数 体内 
的 变量 。 为 此 ， 我 们 可 以 定义 一 个 LCFunction#call 方法 ， 这 个 方法 进行 替换 并 返回 结果: 











class LCFunction 
def call(argument) 
body.replace(parameter, argument) 
end 
end 


这 让 我 们 可 以 模拟 一 个 函数 被 调用 的 时 刻 : 


>> function = 
LCFunction.new( :x, 
LCFunction.new(:y, 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 
) 
) 
s> ->x{ ->y{ xly]}} 
>> argument = LCFunction.new(:z, LCVariable.new(:z)) 
=>->z{z} 
>> function.call(argument) 


=> ->y{->zt{z}y]} 


3. 规约 表达 式 
在 对 一 个 lambda 演算 程序 求 值 的 时 候 ， 函 数 调用 是 唯一 实际 发 生 的 事 ' 


青 ， 因 此 现在 我 们 
































注 8: 正确 的 行为 是 自动 改 掉 函 数 参 数 的 名 字 ， 这 样 就 避免 与 任何 自由 变量 冲突 了 : ->x{ x[y] } 改写 为 等 
价 的 表达 式 ->w { w[y] }， 然 后 再 安全 地 执行 替换 ， 得 到 ->w { w[z[x]] }， 而 x 仍然 是 自由 变量 。 
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准备 实现 #Teplace。 它 会 找到 表达 式 中 函数 调用 能 发 生 的 地 方 ， 然 后 使 用 #call 方法 使 图 
数 调用 发 生 。 我 们 只 需要 能 识别 哪些 表达 式 是 实际 能 调用 的 …… 





class LCVariable 
def callable? 
false 
end 
end 


class LCFunction 
def callable? 
true 
end 
end 


class LCCall 
def callable? 
false 
end 
end 


ee 然后 就 可 以 写 #reduce 了 : 


class LCVariable 
def reducible? 
false 
end 
end 


class LCFunction 
def reducible? 
false 
end 
end 


class LCCall 
def reducible? 


left.reducible? || right.reducible? || left.callable? 


end 


def reduce 
if left.reducible? 


LCCall.new(left.reduce, right) 


elsif right.reducible? 


LCCall.new(left, right.reduce) 


else 
left.call(right) 
end 
end 
end 








在 这 个 实现 中 ， 函 数 调 用 是 唯 














种 能 被 规约 的 语法 。 规 约 LCCall 有 点 像 规约 SIMPLE 里 


的 Add 或 multiply: 如 果 其 中 有 一 个 子 表达 式 可 以 规约 ， 我 们 就 对 甚 规约， 如果 都 不 能 规 
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约 ， 我 们 就 通过 以 右边 的 子 表达 式 作为 左边 于 表达 式 应 该 是 一 个 LCfunction) 的 参数 调 
用 左边 的 子 表达 式 来 实际 执行 调用 。 这 个 策略 称 为 值 调用 求 值 一 一 首先 我 们 把 参数 规约 成 
一 个 不 可 规约 的 值 ， 然 后 再 执行 调用 。 


























使 用 lambda 演算 来 计算 一 下 “一 加 一 "， 以 此 来 测试 我 们 的 实现 : 


>> expression = LCCall.new(LCCall.new(add, one), one) 
=> ->m{->n {n> nf{ -> p{->x{ pplx]] }} Im] } }-> p { -> x { plx] } 
]][-> p { -> x {plx] } 1}] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 

->mf{ -> n {n> n{ -> p{->x {pnp][x]] } } ym] } }[-> p { -> x { p[x] } }] 
[->p { -> x {plx]})] 


r . n{->p{->x{plnlp][x]] } } }][->p{->x{ px]}}] }->p{->x 
p[x 

->p{->x{plx] }}->n{->p{->x{plnlpl[lx]] } } }][->p{->x {plx]}}] 
->x{->n{->p{->x{ pnpl[x]] } } }Ix] }[->p { -> x { p[x] } }] 
->n{->p{->x{plnlpl[lx]] } } }[->p { -> x { plx] } }] 
->p{->x{p[l->p{->x{p[lx] }}[lpl[lx]] }} 

=> nil 


好 吧 ， 有 些 事情 确实 发 生 了 ， 不 过 我 们 没 得 到 想 要 的 结果 最终 的 表达 式 是 -> p { -> x 
{ p[->p { -> x { p[x] } }[p][x]] } }, 但 数字 “二 ”的 lambda 演算 表示 应 该 是 -> p 
{ -> x{ p[p[x]] } })]。 哪 里 错 了 呢 ? 


错误 是 由 我 们 使 用 的 求 值 策略 引起 的 。 结 果 里 还 有 可 规约 的 函数 调用 一 一 例如 调用 -> p 
{ -> x { p[x] } }[p] 可 以 被 规约 成 -> x { p[x] } 一 一 但 #reduce 没有 接触 到 它们 ， 因 为 
它们 是 在 一 个 函数 体内 出 现 的 ， 而 我 们 的 语义 不 会 把 函数 处 理 成 可 规约 的 。” 


但 是 ， 就 像 前 面 6.1.1 市 中 “相等 ”部 分 讨论 的 一 样 ， 两 个 具有 不 同 语法 的 表达 式 如 果 有 
同样 的 行为 仍然 被 认为 是 相等 的 。 我 们 知道 数字 “二 ”的 lambda 演算 表达 式 应 该 是 : 如 
果 我 们 给 它 两 个 参数 ， 它 会 对 第 二 个 参数 调用 第 一 个 参数 两 次 。 让 我 们 试 着 用 两 个 改造 过 
的 变量 inc 和 zero™ 调用 表达 式 ， 然 后 看 一 下 它 实 际 在 做 什么 : 

>> inc, zero = LCVariable.new(:inc), LCVariable.new(:zero) 

=> [inc, zero] 

>> expression = LCCall.new(LCCall.new(expression, inc), zero) 


=> ->p{->xt{pl->pt{->x{ plx]}}pl[x]] } }linc][zero] 


>> while expression.reducible? 





注 9: 为 了 修正 这 个 问题 ， 我 们 可 以 重新 实现 #7educe 方法 ， 使 用 更 激进 的 求 值 策略 (如 应 用 序 求 值 或 者 正 
则 序 求 值 ) 对 函数 体 执行 规约 ， 但 处 理 单一 函数 体 时 通常 都 包含 自由 变量 ， 所 以 需要 一 个 #7eplace 
的 更 健壮 的 实现 。 

注 10: 我 们 对 含有 自由 变量 inc 和 zero 的 表达 式 求 值 是 在 冒险 ,但 幸运 的 是 ， 表 达 式 中 没有 一 个 函数 含有 
这 些 名 字 的 参数 ， 因 此 在 这 个 特例 中 ， 不 管 哪个 变量 被 意外 捕获 都 不 会 有 危险 。 





















































puts expression 
expression = expression.reduce 
end; puts expression 


->p{->x{pl->p{->x{ plx]}}p][lx]l] } }linc][zero] 
-> x {incl-> p { -> x { p[x] } }Linc][x]] }[zero] 
inc[-> p { -> x { p[x] } }linc][zero]] 
inc[-> x { inc[x] }[zero]] 
inc[inc[zero]] 
=> nil 
这 恰好 是 我 们 希望 数字 “二 ”所 要 表现 的 行为 ， I 




















{ p[x] } }[p][x]] } } 看 起 来 与 期 望 的 不 同 ,但 毕 竞 是 正确 的 结果 。 


6.2.3 语法 分 析 


既然 已 经 有 了 工作 语义 ， 我 们 就 通过 为 lambda 演算 表达 式 构 建 一 个 语法 解析 器 来 结束 工 


作 。 像 往常 一 样 ， 我 们 可 以 使 用 Treetop 来 写 语法 : 





grammar LambdaCalculus 
rule expression 
calls / variable / function 


end 
rule calls 
first: (variable / function) rest:('[' expression ']')+ { 
def to ast 
arguments.map(&:to ast).inject(first.to ast) { |1, r| LCCall.new(1，T) } 
end 


def arguments 
rest.elements.map(&:expression) 
end 


} 


end 


rule variable 
[a-z]+ { 
def to ast 
LCVariable.new(text value.to sym) 
end 


} 


end 


rule function 
'-> ' parameter:[a-z]+ ' { ' body:expression ' }' { 
def to ast 
LCFunction.new(parameter.text value.to sym, body.to ast) 
end 
} 
end 
end 
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就 像 在 2.6 节 中 讨论 的 那样 ，Treetop 语法 一 般 会 产生 右 结 合 的 树 ， 因 此 为 
了 适应 lambda 演算 的 左 结合 国 数 调用 语法 ， 这 个 语法 得 做 一 些 额 外 的 工作 。 
这 个 调用 匹配 一 个 或 者 多 个 连续 的 调用 (如 a[b][c]j[d])， 而 得 到 的 具体 语 
法 树 节 点 的 枇 o_ast 方法 使 用 Enumerable#inject 把 这 些 调用 的 参数 转 成 一 个 
左 结合 的 抽象 语法 树 。 























这 个 解析 器 和 操作 语义 一 起 给 出 了 lambda 演算 的 完整 实现 ， 这 允许 我 们 读 取 表 达 式 并 对 
其 求 值 : 














>> require 'treetop" 

=> true 

>> Treetop.load('lambda_calculus') 

=> LambdaCalculusParser 

>> parse tree = LambdaCalculusParser.new.parse('-> x { x[x] }[->y{y +}]') 

=> SyntaxNode+Calls2+Calls1 offset=0, "...}[-> y {y }]" (to ast,arguments,first,rest): 
SyntaxNode+Function1+Function0 offset=0, "... x { x[x] }" (to ast,parameter,body): 

SyntaxNode offset=0, "-> " 


" 


SyntaxNode offset=3, "x": 
SyntaxNode offset=3, "x" 
SyntaxNode offset=4, " {" 
SyntaxNode+Calls2+Calls1 offset=7, "x[x]" (to ast,arguments,first,rest): 
SyntaxNode+Variable0 offset=7, "x" (to ast): 
SyntaxNode offset=7, "x" 
SyntaxNode offset=8, "[x]": 
SyntaxNode+Calls0 offset=8, "[x]" (expression): 
SyntaxNode offset=8, "[" 
SyntaxNode+Variable0 offset=9, "x" (to ast): 
SyntaxNode offset=9, "x" 
SyntaxNode offset=10, "]" 
SyntaxNode offset=11, " }" 
SyntaxNode offset=13, "[->y{y}]": 
SyntaxNode+Cal1s0 offset=13, "[-> y { y }]" (expression): 
SyntaxNode offset=13, "[" 
SyntaxNode+Function1+Function0 offset=14, "... { y }" (to ast,parameter,body): 
SyntaxNode offset=14, "-> " 
SyntaxNode offset=17, "y": 
SyntaxNode offset=17, "y 
SyntaxNode offset=18, " { " 
SyntaxNode+Variable0 offset=21, "y" (to ast): 
SyntaxNode offset=21, "y" 
SyntaxNode offset=22, " }" 
SyntaxNode offset=24, "]" 
>> expression = parse tree.to ast 
=> -> x { x[x] }[->y{y)] 
>> expression.reduce 
= > ->y{y}->y{y}] 





第 7 章 


通用 性 无 处 不 在 








我 们 在 世上 见 到 的 大 多 数 错综复杂 的 事物 都 来 自 于 复杂 的 系统 ， 比 如 哺乳 动物 、 微 处 理 
器 、 经 济 、 天 气 ， 所 以 很 自然 地 以 为 简单 的 系统 只 能 做 简单 的 事情 。 但 在 本 书 中 ， 我 们 已 
经 看 到 ， 简 单 的 系统 可 以 拥有 强大 的 功能 ， 例 如 第 6 章 表 明 ， 即 使 一 种 很 小 的 编程 语言 也 
有 足够 的 能 力 去 做 有 用 的 工作 ， 而 第 5 章 勾 勒 出 了 一 台 通 用 图 灵机 的 设计 ， 它 可 以 读 取 描 
述 另 一 台 机 器 的 编码 ， 然 后 模拟 其 执行 。 























通用 图 灵机 的 存在 是 极其 有 意义 的 。 尽 管 任何 一 台 个 体 的 图 灵机 都 有 一 个 硬 编码 的 规则 手 
册 ， 但 是 通用 图 灵机 证 明了 设计 这 样 一 个 装置 的 可 能 性 ， 这 个 装置 可 以 通过 从 纸 带 读 取 指 
令 来 完成 任何 任务 。 这 些 指令 实际 上 是 控制 机 器 硬件 运行 的 软件 ， 就 像 控 制 我 们 每 天 都 在 
使 用 的 通用 可 编程 计算 机 的 软件 一 样 。 有 限 和 下 推 自动 机 有 点 过 于 简单 ， 不 能 支持 这 种 
全 面 的 可 编程 性 ， 但 是 图 灵机 具有 解决 这 个 问题 的 足够 的 复杂 性 。 

这 一 章 里 ， 我 们 将 探寻 几 个 简单 的 系统 ， 并 将 看 到 它们 都 是 通用 的 一 所 有 这 些 系统 都 具 


有 模拟 图 灵机 的 能 力 ， 因 此 都 能 够 执行 所 输入 的 任意 程序 ， 而 无 需 硬 编码 一 一 这 表明 通用 
性 比 我 们 预期 的 要 常见 得 多 。 



































7.1 lambda 演算 
我 们 已 经 看 到 ，lambda 演算 是 一 种 可 用 的 编程 语言 ， 但 还 没有 探讨 它 是 否 与 图 灵机 一 样 强 





注 1:“ 硬 件 ” 指 的 是 读 / 写 头 、 纸 带 和 规则 手册 。 因 为 图 灵机 通常 只 是 一 个 思维 实验 品 而 不 是 物理 实体 ， 
所 以 从 表面 上 来 讲 它 们 不 是 硬件 ,但 与 写 在 纸 带 上 的 以 字符 形式 存在 的 一 直 在 改变 的 “ 软 ” 信 息 相 比 ， 
它们 是 系统 中 一 个 固定 的 部 分 ， 从 这 个 意义 上 讲 ， 它 们 是 “ 硬 的 ”。 
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大 。 事 实 上 ，lambda 演算 一 定 至 少 有 那么 强大 ， 因 为 它 能 够 模拟 包括 通用 
括 ) 在 内 的 任何 图 灵机 。 


灵机 (当然 包 




















我 们 将 用 lambda 演算 快速 地 实现 一 台 
拟 图 灵机 的 。 





带 ， 来 领略 一 下 它 是 如 何 模 





巍 六 
就 像 在 第 6 章 一 样 ， 我 们 仍 将 采用 Ruby 代码 来 方便 快捷 地 表示 lambda 演 
全 4 、 算 ， 当 然 这 些 代码 只 限于 创建 proc、 调 用 proc 和 使 用 常量 做 缩 略 词 。 

















为 为 Ruby 不 是 我 们 应 该 研究 的 语言 ， 所 以 使 用 它 有 点 冒险 。 但 这 样 做 换 来 
的 是 一 个 熟悉 的 表达 式 语 法 和 一 种 对 表达 式 求 值 的 简单 方法 。 并 且 ， 只 要 保 
持 前 面 的 约束 ， 我 们 的 发 现 就 将 是 有 效 的 。 


















































一 台 图 灵机 的 纸 带 有 4 个 属性 : 出 现在 纸 带 左边 的 字符 列表 、 纸 带 中 间 的 字符 (处 于 图 灵 
机 读 / 写 头 的 位 置 )、 右 侧 的 字符 列表 ， 以 及 被 当成 空白 的 字符 。 我 们 可 以 把 这 4 个 值 表 示 
成 pair 的 pair。 





TAPE -=--，1{->nmf{f->rf{f->b{fpPAIR[PAIR[I][m]][PAIR[r][bl] } } }} 
TAPE LEFT = -> t { LEFT[LEFT[t]] } 

TAPE MIDDLE = -> t { RIGHT[LEFT[t]] } 

TAPE RIGHT = -> t { LEFT[RIGHT[t]] } 

TAPE BLANK = -> t { RIGHT[RIGHT[t]] } 


作为 “构造 函数 ”"，TAPE 用 纸 带 的 4 个 属性 作为 参数 并 返回 一 个 代表 纸 带 的 proc。TAPE_ 
LEFT、TAPE_MIDDLE、TAPE_RIGHT 和 TAPE_BLANK 是 “访问 函数 ”， 可 以 根据 纸 带 状态 的 一 个 表 
示 来 取得 对 应 的 属性 。 

有 了 这 个 数据 结构 ， 我 们 就 可 以 实现 TAPE_WRITE。TAPE_WRITE 把 一 个 纸 带 和 一 个 字符 作为 
输入 参数 ， 返 回 一 个 中 间 位 置 写 有 字符 的 新 纸 带 : 


TAPE WRITE = > t { -> c { TAPE[TAPE LEFT[t]][c][TAPE RIGHT[t]][TAPE BLANK[t]] } } 








我 们 还 可 以 定义 移动 纸 带 头 的 操作 。TAPE_MOVE_HEAD_RIGHT 这 个 proc 直接 从 5.1.4 市 里 
Tape#move_head_right 的 无 限制 的 Ruby 实现 转换 而 来 ， 它 能 够 把 纸 带 头 右 移 一 个 方 格 ”: 





TAPE_ MOVE_HEAD RIGHT = 
->t{ 
TAPE[ 

PUSH[TAPE LEFT[t]][TAPE MIDDLE[t]] 


IF[IS_EMPTY[TAPE RIGHT[t]]][ 
TAPE_BLANK[t] 
1[ 








注 2: TAPE_MOVE_HEAD_LEFT 的 实现 类 似 ， 只 是 要 求 一 些 没 有 在 6.1.8 市 中 额外 定义 的 列表 操作 函数 。 








FIRST[TAPE_RIGHT[t]] 
] 


IF[IS_EMPTY[TAPE_RIGHT[t]]][ 
EMPTY 


REST[TAPE_RIGHT[t]] 
] 


TAPE_BLANK[t] 


] 
} 


总 而 言 之 ， 这 些 操 作 给 予 了 我 们 创建 纸 带 、 对 纸 带 进行 读 写 并 来 回 移动 纸 带 头 所 需要 的 一 
切 。 例 如 ， 我 们 可 以 从 一 个 空 的 纸 带 开 始 ， 然 后 在 连续 的 方 格 内 写 人 一 串 数字 。 





>> current tape = TAPE[EMPTY][ZERO][EMPTY][ZERO] 

=> #<Proc (lambda)> 

>> current tape = TAPE WRITE[current tape][ONE] 

=> #<Proc (lambda)> 

>> current tape = TAPE MOVE_HEAD RIGHT[current tape] 

=> #<Proc (lambda)> 

>> current tape = TAPE WRITE[current tape][TwO] 

=> #<Proc (lambda)> 

>> current tape = TAPE MOVE HEAD RIGHT[current tapel] 

=> #<Proc (lambda)> 

>> current tape = TAPE WRITE[current tape][THREE] 

=> #<Proc (lambda)> 

>> current tape = TAPE MOVE_HEAD RIGHT[current_tape] 

=> #<Proc (lambda)> 

>> to array(TAPE_ LEFT[current tapel]).map { |p| to integer(p) } 
= [1， 2， 3] 

>> to_integer(TAPE MIDDLE[current tape]) 

=> 0 
>> to _array(TAPE _ RIGHT[current tape]).map { |p| to integer(p) } 
=> [] 








我 们 将 跳 过 其 他 细 市 ， 但 是 继续 像 这 样 基于 proc 来 构建 对 状态 、 配 置 、 规 则 和 规则 手册 的 
表示 并 不 困难 。 有 了 全 部 这 些 ， 我 们 就 可 以 写 出 只 基于 proc 的 DTM#step 和 DTM#run 的 实 
现 : STEP 通过 对 一 个 配置 应 用 规则 手册 并 生成 另外 一 个 配置 ， 模 拟 了 一 台 图 灵机 的 一 步 ， 
而 RUN 会 使 用 乙 组 合子 反复 调用 STEP， 直 到 没有 规则 可 用 或 机 器 到 达 停 机 状态 ， 这 样 就 模 
拟 了 一 台 机 器 的 完整 执行 。 












































换 句 话说 ，RUN 是 一 个 可 以 模拟 任何 图 灵机 的 lambda 演算 程序 。 事 实证 明 ， 相 反 的 情况 
也 是 可 能 的 : 就 像 6.2.2 而 所 描述 的 ， 通 过 在 纸 带 上 存储 一 个 lambda 表达 式 的 描述 ， 并 不 
断根 据 一 系列 规约 规则 对 其 进行 修改 ， 一 台 图 灵机 可 以 作为 lambda 演算 的 解释 器 。 























注 3: 术语 图 灵 完 备 经 常用 来 描述 一 个 系统 或 者 一 种 编程 语言 能 模拟 任何 图 灵机 。 
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咕 一 | 因为 每 一 台 图 灵机 都 能 由 lambda 演算 程序 模拟 ， 而 每 一 个 lambda 演算 程序 
全 和 Ri 人 入， 过 人 条 人 人 
由 惊 ， 因 为 图 灵机 和 ambda 演算 程序 以 完全 不 同 的 方式 工作 ， 我 们 此 前 没有 

料 到 它们 竟然 具有 同样 的 能 









































这 意味 着 至 少 有 一 种 方式 可 以 模拟 lambda 演算 本 身 : 首先 使 用 lambda 演算 实现 一 台 图 灵 
机 ， 然 后 使 用 这 人 台 模 拟 出 来 的 机 器 运行 lambda 解释 器 。“ 模 拟 机 中 再 模拟 ”是 一 种 低 效 的 
做 事 方式 。 我 们 可 以 通过 设计 数据 结构 表示 lambda 演算 表达 式 ， 然 后 直接 实现 运算 语义 
达到 同样 目的 。 但 这 确实 表明 lambda 演算 不 必 再 创建 任何 新 的 东西 就 肯定 是 通用 的 了 。 
自 解释 器 是 通用 图 灵机 的 lambda 演算 版 本 : 即使 底层 的 解释 程序 是 固定 的 ， 我 们 也 可 以 
通过 提供 合适 的 lambda 表达 式 作为 输入 来 让 它 做 任何 工作 。 









































如 前 所 述 ， 通 用 系统 的 真正 好 处 是 它 能 被 编程 以 执行 不 同 的 任务 ， 而 不 是 总 要 硬 编码 来 。 
特别 地 ， 通 用 系统 能 被 编程 来 模拟 任何 其 他 的 通用 系统 ， 通 用 图 灵机 能 计算 lambda 演算 
表达 式 的 值 ， 而 lambda 演算 解释 器 也 能 模拟 图 灵机 。 


7.2 ”部 分 递归 函数 


lambda 演算 表达 式 完全 由 procs 的 创建 和 调用 组 成 ， 部 分 递归 函数 与 其 大 致 相同 ， 由 四 个 
部 分 组 合 构成 。 前 两 部 分 叫 作 zero 和 increment， 我 们 可 以 使 用 Ruby 实现 它们 。 












































def zero 
0 
end 


def increment(n) 
n+1 
end 


这 两 个 方法 很 直观 ， 分 别 返 回 数字 0 和 往 一 个 数字 上 加 1: 


>> zero 

=> 0 

>> increment(zero) 

=> 1 

>> increment(increment(zero)) 
=> 2 





下 面 使 用 #zero 和 #increment 来 定义 一 些 新 方法 : 














>> def two 
increment(increment(zero)) 
end 
=> nil 





>> two 
=> 2 
>> def three 
increment (two) 
end 
=> nil 
>> three 
=> 3 
>> def add three(x) 
increment(increment(increment(x))) 
end 
=> nil 
>> add_ three(two) 
=> 5 


第 三 个 方法 #zecurse 更 为 复杂 : 


def recurse(f, g, *values) 
*other values, last value = values 


if last value.zero? 
send(f, *other values) 
else 
easier last value = last value - 1 
easier values = other values + [easier last value] 


easier result = recurse(f, g, *easier values) 
send(g, *easier values, easier result) 
end 
end 





方法 #recurse 用 两 个 方法 的 名 字 和 8&g 作为 参数 ， 并 且 使 用 它们 对 一 些 输 入 值 执行 递归 计 
算 。 根 据 最 后 的 输入 值 ， 调 用 #recurse 的 直接 结果 是 通过 委托 给 或 者 g 计算 得 出 的 。 


。 如 果 最 后 的 输入 值 是 零 ， 抽 ecurse 把 其 他 值 作为 参数 ， 调 用 名 为 f 的 方法 。 
。 如 果 最 后 的 输入 不 是 零 , #recurse 使 其 递减 , 并 用 修改 之 后 的 输入 值 作为 参数 调用 自身 ， 
然后 用 那些 相同 的 值 和 递归 调用 的 结果 调用 名 为 g 的 方法 。 





这 听 起 来 比 实际 复杂 ; 机 ecurse 只 不 过 是 定义 某 种 递归 函数 的 模板 。 比 如 ， 我 们 可 以 
用 其 定义 一 个 函数 #add， 这 个 函数 带 有 两 个 参数 x 和 y， 它 把 它们 加 到 一 起 。 为 了 使 用 
frecurse 构建 此 函数 ， 我 们 需要 实现 两 个 其 他 的 函数 ， 以 回答 下 面 这 些 问 是 。 




















。 给 定 x 的 值 ，add(x，0) 的 值 是 多 少 ? 
。 给 定 x、y-1 和 add(x，y-1) 的 值 ，add(x,y) 的 值 是 多 少 ? 


第 一 个 问题 简单 ， 一 个 数字 加 零 不 会 有 变化 ， 所 以 如 果 我 们 知道 x 的 值 ，add(x，0) 的 
值 将 是 相同 的 。 我 们 可 以 将 其 实现 为 一 个 叫 #add_zero_to_x 的 函数 ， 这 个 函数 只 返回 它 的 
参数 ， 
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def add zero to x(x) 
Xx 
end 


第 二 个 问题 要 难 一 点 ， 但 是 回答 起 来 仍然 足够 简单 : 如果 已 经 有 了 add(x，y-1) 的 值 ， 
我 们 只 要 将 其 递增 就 能 得 到 add(x，y) 的 值 “。 这 意味 着 需要 一 个 能 增加 其 第 三 个 参数 
值 的 函数 (#recurse 用 x、y-1 和 add(x，y-1) 作为 参数 来 调用 它 )。 我 们 管 这 个 函数 叫 
#increment easier result. 

def increment easier result(x, easier y, easier result) 


increment(easier result) 
end 


把 这 些 放 到 一 起 我 们 就 得 到 了 #add 的 定义 ， 它 由 #recurse 和 提 ncrement 构造 出 来 : 


def add(x, y) 
recurse(:add zero to x, :increment easier result, x, y) 








end 

于 3 
2 第 6 章 的 思路 同样 适用 于 这 里 : 为 了 给 表达 式 取 方 便 的 名 字 ， 我 们 只 使 用 函 
A 











4 有。 数 的 定义 ， 而 不 会 偷偷 地 递归 进 它们 *。 如 果 想 要 写 一 个 递归 国 数 ， 我 们 需 
4 要 使 用 #recurse。 


来 确认 一 下 #add 在 做 它 该 做 的 事情 : 





>> add(two, three) 
=> 5 


看 起 来 很 好 。 我 们 可 以 用 同样 的 策略 来 实现 其 他 熟悉 的 例子 ， 比 如 #multiply.…: 


def multiply_x_by_zero(x) 
zero 
end 


def add x to easier result(x, easier y, easier result) 


add(x, easier result) 
end 


def multiply(x, y) 
recurse(:multiply x by zero, :add x to easier result, x, y) 
end 

















注 4: 因为 减法 是 加 法 的 逆 运 算 ， 所 以 (x+(y-1))+1=(x+(y+-1))+1。 因 为 加 法 的 结合 律 ， 所 以 (x+(y+- 
1))+1=(x+y)+(-1+1)。 而 因为 -1+1=0， 这 在 加 法 中 是 恒等式 ， 所 C(x+y)+(-1+1)=x+y。 

注 5: 当然 #7Yecurse 本 身 的 实现 从 根本 上 使 用 了 递归 方法 的 定义 ， 但 这 是 允许 的 ， 因 为 我 们 是 把 #recurse 
当成 系统 的 4 个 内 建 原 语 而 不 是 用 户 定义 方法 来 处 理 的 。 
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还 有 #decTrement : 


def easier x(easier x, easier result) 
easier x 
end 


def decrement(x) 
recurse(:zero, :easier x, x) 
end 


还 有 #subtract: 


def subtract zero from x(x) 
x 
end 


def decrement easier result(x, easier y, easier result) 
decrement(easier result) 
end 


def subtract(x, y) 
recurse(:subtract zero from x, :decrement easier result, x, y) 
end 


这 些 实现 运行 得 都 和 预期 一 样 : 


>> multiply(two, three) 
=> 6 
>> def six 
multiply(two, three) 
end 
=> nil 
>> decrement(six) 


>> subtract(six, two) 
=> 4 
>> subtract(two, six) 
=> 0 


我 们 从 #zero、 失 ncrement 和 #recurse 组 合 出 来 的 程序 叫 原 始 递 归 函 数 。 


所 有 的 原始 递归 函数 都 是 完全 的 : 不 管 输入 什么 ， 它 们 总 是 可 以 停止 并 返回 一 个 结果 。 这 是 
因为 #recurse 是 定义 递归 国 数 的 唯一 合法 方式 ， 而 #7ecurse 是 总 能 停止 的 : 每 一 个 递归 调用 
都 会 使 其 最 后 一 个 参数 更 接近 零 ， 而 在 它 最 后 不 可 避免 地 成 为 零 时 ， 递 归 就 会 停止。 


方法 #zero、 提 ncrement 以 及 #recurse 足以 构造 许多 有 用 的 国 数 ， 这 其 中 包括 图 灵机 执行 
单独 一 步 的 所 有 操作 :一 个 图 灵机 纸 带 的 内 容 可 以 表示 成 一 个 大 数 ， 可 以 用 原始 递归 函数 
来 读 纸 带头 当前 位 置 的 字符 、 往 纸 带 上 写 新 的 字符 以 及 左右 移动 纸 带 头 。 但 是 ， 因 为 有 些 
图 灵机 是 永远 循环 的 ， 所 以 我 们 没 法 使 用 原始 递归 函数 模拟 任意 一 台 图 灵机 的 完整 运行 ， 
因此 原始 递归 函数 并 不 是 通用 的 。 
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为 了 得 到 真正 的 通用 系统 ， 我 们 可 以 增加 第 四 个 基础 操作 一 一 #minimize: 


def minimize 


hi 二 人 光 
n= n+ 1 until yield(n).zero? 
n 

end 


方法 iinimize 接受 一 个 块 ， 并 不 断 地 使 用 一 个 数字 作为 参数 重复 调用 它 。 第 一 次 调用 时 ， 
参数 是 0， 然 后 是 1， 然 后 是 2， 之 后 一 直 用 越 来 越 大 的 值 做 参数 调用 块 ， 直 到 返回 零 为 目 。 








通过 在 #zero、#increment 和 #recurse 中 加 入 #minimize， 我 们 可 以 构造 更 多 的 国 数 一 一 
所 有 的 部 分 递归 函数 一 一 包括 那些 永远 不 会 停止 的 函数 。 例 如 ，#minimize 让 我 们 很 容易 
实现 #divide: 

def divide(x, y) 


minimize { |n| subtract(increment(x), multiply(y, increment(n))) } 
end 





。y*(n+1) 大 于 XxX 就 返回 零 。 如 果 试 图 用 13 除 以 4 (x=13，y=4)， 我 们 来 看 一 
下 随 着 n 的 增长 y*(n+1) 的 值 的 变化 : 





泣 纪 
、 把 表达 式 subtract(increment(x)，multiply(y，increment(n))) 设计 成 如 果 
~ 








n x y*(n+1) y*(n+1) 比 x 大 了 吗 ? 
0 13 4 否 
1 13 8 否 
2 13 12 否 
3 13 16 是 
4 13 20 是 
5 13 24 是 


第 一 个 满足 条 件 的 mn 值 是 3， 这样 在 n 到 达 3 的 时 候 我 们 传 给 tmimimize 的 块 
会 返回 零 ， 所 以 得 到 了 divide(13,4) 的 结果 3。 








就 像 原始 递归 函数 一 样 ，#divide 收 到 有 意义 的 参数 时 总 会 返回 一 个 结果 : 








>> divide(six, two) 
=> 3 
>> def ten 
increment(multiply(three, three)) 
end 
=> nil 
>> ten 
=> 10 
>> divide(ten, three) 
=> 3 





A 
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但 是 因为 各 inimize 能 永远 循环 ， 所 以 #divide 不 一 定 要 返回 一 个 结果 。 被 零 除 是 未 定义 的 : 


>> divide(six, zero) 
SystemStackError: stack level too deep 





因为 和 ininize 的 实现 是 迭代 的 ， 而 且 没有 直接 增加 调用 栈 ， 所 以 这 里 看 
一。 到 枝 溢 出 有 点 奇怪 ， 但 是 溢出 发 生 在 divide 对 递归 函数 和 ultiply 的 调用 
期 间 。#multiply 的 递归 深度 由 它 的 第 二 个 参数 increment(n) 决定 ， 而 随 着 
iminimize 的 循环 试图 一 直 运行 下 去 ，n 的 值 变 得 很 大 ， 最 终 导致 了 栈 溢 出 。 

















有 了 #minimize， 通 过 重复 调用 原始 递归 函数 来 执行 模拟 中 的 一 步 ， 就 可 能 完全 模拟 一 台 
图 灵机 。 在 停机 之 前 模拟 一 直 运 行 一 一 如 果 永 远 不 停机 ， 那 模拟 就 会 永远 运行 。 


7.3” SKI 组 合子 演算 


就 像 lambda 演算 一 样 ，SKI 组 合子 演算 是 一 个 处 理 表 达 式 语法 的 规则 系统 。 尽 管 lambda 
演算 已 经 很 简单 了 ， 但 仍然 还 有 三 种 表达 式 : 变量 、 函 数 和 调用 。 我 们 在 6.2.2 节 中 看 到 
变量 使 规约 的 规则 有 点 复杂 。SKI 演算 更 简单 ， 它 只 有 两 种 表达 式 : 调用 和 字母 符号 ， 规 
则 也 更 简单 。 它 所 有 的 能 力 都 源 于 三 个 特别 的 符号 S、K 和 工 ( 叫 作 组 合子 ) ， 它 们 每 一 个 
都 有 自己 的 归 约 规则 : 














。 5S[a]l[b][c] 规约 成 a[c][b[c]]， 其 中 a、b 和 fc 可 以 是 任意 的 SKI 演算 表达 式 ， 
。 K[a][b] 规约 成 ai 
。 I[a] 规约 成 a。 





例如 ， 下 面 是 规约 表达 式 ILS]LKILS][ILK]] 的 一 种 方式 : 
I[S][K][S][I[]] 











上 : 业 泪 时 


注意 ， 这 里 没有 lambda 演算 那 种 变量 替换 ， 有 的 只 是 根据 规约 规则 对 符号 进行 的 记录 、 
制 和 丢弃 。 


很 容易 实现 SKI 表达 式 的 抽象 语法 : 


主 
复 


class SKISymbol < Struct.new(:name) 
def to _s 
name.to s 
end 


def inspect 
tos 
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end 
end 


class SKICall < Struct.new(:left, :right) 
def to_s 
"#{left}[#{right}]" 
end 


def inspect 
tos 
end 
end 


class SKICombinator < 9KI9ymbol 
end 


S, K, I = [:S, :K, :I].map { |name| SKICombinator.new(name) } 








1 3 
es 为 了 一 般 性 地 表示 调用 和 符号 ， 这 里 我 们 定义 了 类 SKICall 和 SKISymbol， 然 
心 。 后 创建 了 一 次 性 实例 S、K 和 工 来 表示 作为 组 合子 的 那些 特定 符号 。 
人 
我 们 没有 直接 让 S、K 和 工 成 为 SKISymbol 的 实例 ， 而 是 使 用 了 子 类 SKICominator 


的 实例 。 这 对 我 们 现在 没有 帮助 ， 但 是 它 会 简化 以 后 往 三 个 组 合子 对 象 中 增 
加 方法 的 工作 。 








这 些 类 和 对 象 能 被 用 来 构建 SKI 表达 式 的 抽象 语法 树 : 


>> x = SKISymbol.new(:x) 

=> X 

>> expression = SKICall.new(SKICall.new(S, K), SKICall.new(I, x)) 
=> S[K][I[x]] 


通过 实现 SKI 演算 的 规约 规则 并 在 表达 式 中 应 用 这 些 规则 可 以 为 SKI 演算 赋予 一 个 小 步 操 
作 语 义 。 首 先 ， 我 们 将 在 SKICombinator 实例 上 定义 一 个 叫 作 #call 的 方法 ; 5S、K 和 工 都 
有 它们 自己 #call 的 定义 ， 实 现 了 它们 的 归 约 规则 : 








# 规约 S[a][bj[c] 为 a[c][b[c]] 
def S.call(a, b, c) 

SKICall.new(SKICall.new(a, c), SKICall.new(b, c)) 
end 


# 规约 K[a][b] 为 0 a 
def K.call(a, b) 

a 
end 


# 规约 I[a] 为 a 
def I.call(a) 

a 
end 





好 了 ， 如 果 知 道 调用 组 合子 的 参数 是 什么 ， 我们 就 有 了 一 种 应 用 演算 规则 的 方式 …… 


>> y, z = SKISymbol.new(:y), SKISymbol.new(:z) 
=> [y, z] 

>> S.call(x, y, z) 

=> x[z][y[z]] 


ee 但 要 对 一 个 真正 的 SKI 表达 式 使 用 #call 方法 ， 我 们 还 需要 从 中 提取 出 一 个 组 合子 和 
几 个 参数 。 因 为 一 个 表达 式 是 用 一 个 SKICall 对 象 组 成 的 二 又 树 表 示 的 ， 所 以 这 有 点 芍 琐 : 


>> expression = SKICall.new(SKICall.new(SKICall.new(S, x), y), z) 
-> S[x][y][z] 

>> combinator = expression.left.left.left 

=> 9 

>> first argument = expression.left.left.right 

=> X 

>> second argument = expression.left.right 

夺 » y 

>> third argument = expression.right 

= 之 

>> combinator.call(first argument, second argument, third argument) 


=> x[z][y[z]] 
为 了 让 这 个 结构 更 容易 处 理 ， 我 们 可 以 在 抽象 语法 树 上 定义 方法 #combinator 和 #arguments: 














class SKISymbol 
def combinator 
self 
end 


def arguments 
[] 
end 
end 


class SKICall 
def combinator 
left.combinator 
end 


def arguments 
left.arguments + [right] 
end 
end 


这 样 很 容易 发 现 要 调用 哪个 组 合子 以 及 传 给 它 什 么 参数 : 


>> expression 

=> S[x][y][z] 

>> combinator = expression.combinator 
=> 9 

>> arguments = expression.arguments 
二 [x, y; z] 
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>> combinator.call(*arguments) 


=> x[z][y[z]] 


这 对 S[x][y][z] 工作 得 很 好 ， 但 在 通常 情况 下 会 有 一 些 问题 。 首 先 #combinator 方法 只 是 
返回 一 个 表达 式 最 左 侧 的 符号 ， 但 那个 符号 不 一 定 是 个 组 合子 : 





>> expression = SKICall.new(SKICall.new(x, y), z) 


=> x[y][z] 
>> combinator = expression.combinator 
=> X 

>> arguments = expression.arguments 
= [y, z] 


>> combinator.call(*arguments) 
NoMethodError: undefined method “call' for x:SKISymbol 


第 二 ， 就 算 最 左 侧 的 符号 是 一 个 组 合子 ， 它 也 不 一 定 被 用 合适 数目 的 参数 调用 : 


>> expression = SKICall.new(SKICall.new(S, x), y) 


=> S[x][y] 

>> combinator = expression.combinator 
=> 9 

>> arguments = expression.arguments 
= [x, y] 


>> combinator.call(*arguments) 
ArgumentError: wrong number of arguments (2 for 3) 


为 了 避免 这 两 个 问题 ， 我 们 将 定义 #callable? 方法 以 检测 是 否 适合 以 方法 #combinator 和 


#argument 的 结果 来 使 用 #call。 一 个 符号 永远 都 无 法 调用 ， 而 一 个 组 合子 只 有 在 参数 个 数 
正确 的 情况 下 才 可 以 调用 : 





class SKISymbol 
def callable?(*arguments) 
false 
end 
end 


def S.callable?(*arguments) 
arguments.length == 
end 


def K.callable?(*arguments) 
arguments.length == 
end 


def I.callable?(*arguments) 
arguments.length == 
end 








顺便 说 一 下 ，Ruby 已 经 有 办 法 回答 一 个 方法 需要 多 少 个 参数 了 ( 它 的 参数 
、 数 量 ) : 





>> def add(x，y) 
x+y 

end 
=> nil 
>> add method = method(:add) 
=> #<Method: Object#add> 
>> add method.arity 
=> 2 


因此 ， 我 们 可 以 用 一 个 共享 #callable 实现 来 替换 Ss、K 和 I 各 自 的 实现 : 


class SKICombinator 
def callable?(*arguments) 
arguments.length == method(:call).arity 
end 
end 





现在 可 以 识别 归 约 规则 直接 适用 的 表达 式 了 : 


>> expression = SKICall.new(SKICall.new(x, y), z) 

=> x[y][z] 

>> expression.combinator.callable?(*expression.arguments) 
=> false 

>> expression = SKICall.new(SKICall.new(S, x), y) 

=> SLx][y] 

>> expression.combinator.callable?(*expression.arguments) 
=> false 

>> expression = SKICall.new(SKICall.new(SKICall.new(S, x), y), z) 
=> S[x][y][z] 

>> expression.combinator.callable?(*expression.arguments) 
=> true 


最 后 ， 我 们 可 以 为 SKI 表达 式 实现 熟悉 的 #7educible? 和 #reduce 方法 了 : 


class SKISymbol 
def reducible? 
false 
end 
end 


class SKICall 
def reducible? 
left.reducible? || right.reducible? || combinator.callable?(*arguments) 
end 


def reduce 
if left.reducible? 
SKICall.new(left.reduce, right) 
elsif right.reducible? 
SKICall.new(left, right.reduce) 
else 
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combinator.call(*arguments) 
end 
end 
end 


a 








SKICall#reduce 递归 查找 我 们 已 经 知道 如 何 规约 的 子 表达 式 (例如 正在 以 三 
。 个 参数 进行 调用 的 $ 组 合子 )， 然 后 使 用 #call 应 用 合适 的 规则 。 


， 
“A 








那 就 是 它 了 ! 我 们 现在 可 以 对 SKI 表达 式 不 断 规约 ， 直 到 不 能 规约 为 止 。 例 如 ， 下 面 使 用 
符号 x 和 y 调用 表达 式 S[KLS[I]]][K]， 它 交换 了 两 个 参数 的 顺序 : 


>> swap = SKICall.new(SKICall.new(S, SKICall.new(K, SKICall.new(S, 1))), K) 
=> SLKLSLI]]]LK] 
>> expression = SKICall.new(SKICall.new(swap, x), y) 
=> SLKLS[I]]]IK][x][y] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 
[S[I]][K][xj[y] 
人 
K[x]][y] 
K[x][y]] 
y]] 





SKI 演算 用 三 个 简单 的 规则 就 产生 了 出 人 意料 的 复杂 行为 。 事 实 上 ， 复 杂 到 被 证 明 是 通用 


的 了 。 


我 们 可 以 证 明 SKI 表达 式 的 通用 性 ， 方 法 是 展示 如 何 把 任意 的 lambda 演算 表达 式 


转换 成 做 同样 事情 的 一 个 SKI 表达 式 ， 这 实际 上 也 是 使 用 SKI 演算 给 了 lambda 演算 一 个 
指称 语义 。 我 们 已 经 知道 lambda 演算 是 通用 的 ， 因 此 如 果 SKI 能 完全 模拟 它 ， 就 能 得 出 
SKI 演算 也 是 通用 的 结论 














转换 的 核心 是 一 个 叫 #as_a_function_of 的 方法 : 


class SKISymbol 
def as a_function of(name) 
if self.name == name 
I 
else 
SKICall.new(K, self) 
end 
end 
end 


class SKICombinator 
def as a_function of(name) 
SKICall.new(K, self) 
end 
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end 


class SKICall 
def as a_function of(name) 
left function = left.as a function of(name) 
right function = right.as a function of(name) 


SKICall.new(SKICall.new(S, left function), right function) 
end 
end 


方法 #as_a_function_of 的 工作 细节 并 不 重要 ， 但 粗略 上 讲 ， 它 把 一 个 SKI 表达 式 转 成 一 
个 新 的 表达 式 ， 这 个 表达 式 在 用 一 个 参数 调用 时 会 转 回 到 原来 的 表达 式 。 例 如 ， 表 达 式 
S[K][I] 被 转 成 S[S[K[S]][K[K]]][K[I]]: 


>> original = SKICall.new(SKICall.new(S, K), I) 
=> S[K][I] 

>> function = original.as a function of(:x) 

=> SLS[KLS]][KIK]]]IKLI]] 

>> function.reducible? 

=> false 











在 S[SLKLS]]J[KLK]]]LK[I]] 以 一 个 参数 比如 说 y 进行 调用 的 时 候 ， 它 将 会 规约 回 SLK][I] : 


>> expression = SKICall.new(function, y) 
=> S[SLKLS]][KLK]]][LKLI]] [LY] 

>> while expression.reducible? 

puts expression 

expression = expression.reduce 

nd; puts expression 


[S]][K[K]]][K[I][y] 


>> expression == original 
=> true 


只 是 在 原始 表达 式 也 包含 有 那个 名 字 的 符号 时 参数 name 才 会 用 到 。 在 那 种 情况 下 ，#as_a_ 
function_of 会 产生 一 些 更 有 意思 的 东西 : 一 个 表达 式 ， 在 使 用 一 个 参数 进行 调用 的 时 候 ， 
它 会 规约 成 原始 表达 式 ， 甚 中 那个 参数 会 替换 掉 符 号 : 


>> original = SKICall.new(SKICall.new(S, x), I) 
=> S[x][I] 
>> function = original.as a_function_of(:x) 
=> S[S[K[S]][I][K[I]] 
>> expression = SKICall.new(function, y) 
=> S[S[K[S]][I][K[I]][y] 
>> while expression.reducible? 
puts expression 
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expression = expression.reduce 
end; puts expression 


sS[S[K[5]][I]][KLI][y] 
S[K[S]][I[y][KLI[y]] 
K[S][y][I[y]][KLIJ[y]] 
s[I[y]][K[I][y]] 
s[y][k[I][y]] 

s[y][I] 

=> nil 

>> expression == original 
=> false 


一 个 lambda 演算 函数 在 被 调用 时 ， 函 数 体 内 的 变量 会 被 蔡 换 掉 ， 上 面 是 对 这 种 方式 的 一 
个 明确 的 重新 实现 。 本 质 上 说 ，#as_a_function_of 给 了 我 们 使 用 SKI 表达 式 作为 函数 体 
的 方法 : 它 创建 了 一 个 新 的 表达 式 ， 这 个 表达 式 的 行为 就 像 带 有 一 个 特定 函数 体 和 一 个 参 
数 名 的 函数 ， 只 不 过 SKI 演算 没有 函数 语法 而 已 。 


SKI 演算 模拟 函数 的 能 力 把 lambda 演算 表达 式 与 SKI 表达 式 的 转换 变 得 直接 。lambda 
演算 变量 和 调用 成 为 了 SKI 演算 的 符号 和 调用 ， 而 每 一 个 lambda 演算 函数 体 用 #as_a_ 
function_of 转 成 了 一 个 SKI 演算 “函数 ”: 





class LCVariable 
def to ski 
SKISymbol.new(name) 
end 
end 


class LCCall 
def to ski 
SKICall.new(left.to ski, right.to ski) 
end 
end 


class LCFunction 
def to ski 
body.to ski.as a function of(parameter) 
end 
end 





让 我 们 通过 把 数字 “2”( 参 见 6.1.3 节 ) 的 lambda 演算 表示 转 成 SKI 演算 来 检查 一 下 这 个 
转换 : 

>> two = LambdaCalculusParser.new.parse('-> p { ->x{fprp[x]] } }').to ast 

=> ->p{->x{plplxl] }} 

>> two.to_ski 

=> S[SLKLS]][SLK[K]][I]]]IISISTKLSI]LSLKEKIIIIII CKII]]] 
SKI 演算 表达 式 S[S[K[S]][S[KLK]][I]]]LSLSLK[S]]LSEKLK]][I]]ILK[I]]] 与 ->p{->x{p[p[x]]}} 
做 的 事情 一 样 吗 ? 应 该 是 在 其 第 二 个 参数 上 调用 它 的 第 一 个 参数 两 次 ， 因 此 我 们 可 以 尝试 
给 它 一 些 参数 来 看 看 它 实 际 是 怎么 做 的 ， 就 像 在 6.2.2 市 看 到 的 那样 : 























>> inc, zero = SKISymbol.new(:inc)，SKISymbol.new(:zero) 
=> [inc, zero] 
>> expression = SKICall.new(SKICall.new(two.to ski, inc), zero) 
=> S[SLKLS]][SLKLK]]LII]]ISISEKLS]]LSLKLK]I LI IIKLI]] I Linc] [zero] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 




















S[S[K[S]][S[K[K]][I]]J[S[S[K[S]][S[K[KJ[IJ]IKLI]]]JLincj[zero] 
sS[K[S]][S[K[G][I][inc][Ss[S[KLS]]LS[K[K]][I]]IK[I][inc]][zero] 
K[S][incj[S[K[K]][I][inc]]j[S[SLK[S]][SIK[KJ][IJJIKLII][inc]][zero] 
S[S[K[K]][I][inc]jj[S[S[K[S]][SLK[K][I]]IKLI]]Linc]][zero] 
S[K[K][inc][I[incj]][Ss[S[K[S]]LS[KLK]]II]]]LK[I]J[inc]]j[zero] 
S[K[I[inc]j]][S[S[K[S]][S[K[K]]LI]]][K[I][inc]j][zero] 
S[K[inc]j[S[s[K[S]][SLK[KJ][I]]IKLI]][inc]j[zero] 
S[K[inc]j[S[K[S]][S[KLK]][I][inc][K[I]Linc]]]j[zero] 
S[K[inc]j[K[S][inc][S[K[K]][I]Linc]][KLI][inc]]][zero] 
S[K[inc]j[S[S[K[G][I[inc]][KLI][inc]]]j[zero] 
S[K[inc]j[S[K[K][inc]LI[inc]]][K[I][inc]j]][zero] 
S[K[inc]][S[K[I[inc]]][K[I][inc]]][zero 
S[K[inc]][S[K[inc]][K[I][inc]]][zero] 
S[K[inc]][S[K[inc]][I]][zero] 

K[inc][zero][S[K[inc]][I][zero]] 

inc[S[K[inc]][I][zero]] 

inc[K[inc][zero][I[zero]]] 

inc[inc[I[zero]]] 

inc[inc[zero]] 





=> nil 
可 以 确定 了 ， 使 用 叫 inc 和 zero 的 符号 调用 转换 过 的 表达 式 求 值 为 inc[inc[zero]]， 这 正 
是 我 们 所 想 要 的 。 同 样 的 转换 对 任何 其 他 lambda 表达 式 也 能 成 功 执行 ， 因 此 SKI 组 合子 
演算 可 以 完全 模拟 lambda 演算 ， 从 而 它 一 定 是 通用 的 。 














Ef 3 
es 尽管 SKI 演算 有 三 个 组 合子 ， 但 工 组 合子 实际 上 是 元 余 的 。 有 许多 表达 式 只 
RS 4 ， 含 有 5 和 K， 它 们 做 的 事情 和 一样， 例如 S[KJ][K]: 

DS 


>> identity = SKICall.new(SKICall.new(S, K), K) 
=>S[K][K] 
>> expression = SKICall.new(identity, x) 
=>S[K][K][x] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 

S[K][K][x] 
K[x][K[X]] 
X 
=> nil 











可 见 S[KJ[K] 的 行为 与 1 一 样 ， 这 对 任何 形式 为 S[K][ 任意 ] 的 SKI 表达 式 
都 成 立 。I 组 合子 是 我 们 非 必 需 的 语法 糖 。 对 于 通用 性 来 说 ， 两 个 组 合子 5 
和 就 是 够 了 。 
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7.4 的 塔 (lota) 


























L[ cx ] 可 以 规约 成 xc [S][K] 。 
我 们 的 SKI 演算 实现 让 加 入 一 个 新 的 组 合子 变 得 很 容易 : 





IOTA = SKICombinator.new( "1 


# 规约 :[a] 为 a[S][K] 

def IOTA.call(a) 
SKICall.new(SKICall.new(a, S), K) 

end 


def IOTA.callable?(*arguments) 
arguments.length == 1 
end 


希腊 字母 约 塔 (1) 是 可 以 添加 到 SKI 演算 里 的 另 一 个 组 合子 。 下 面 是 它 的 规约 规则 : 


Chris Barker 提交 了 一 种 叫 作 Iota (http://semarch.linguistics.fas.nyu.edu/barker/Iota/) 的 语 


言 ， 它 的 程序 只 使 用 ! 组 合子 。 尽 管 只 有 一 个 组 合子 ， 0 ee 用 语言 ， 因 








何 SKI 演算 表达 式 都 可 以 转 成 它 ， 而 我 们 已 经 看 到 SKI 演算 是 通 
可 以 通过 应 用 这 些 禁 换 规 则 把 SKI 表达 式 转 成 Iota: 


。 用 1[1[1i[i[111]1] 替换 5; 
。 用 1[1[1[1]]] 替换 Kk， 
。 用 1[1] 替换 工 。 


很 容易 实现 这 个 转换 : 


class SKISymbol 
def to iota 
self 
end 
end 


class SKICall 
def to iota 
SKICall.new(left.to iota, right.to iota) 
end 
end 


def S.to iota 
SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, IOTA)))) 
end 


def K.to iota 
SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, IOTA))) 
end 


为 任 





def I.to iota 
SKICall.new(IOTA, IOTA) 
end 


5、K 和 I 组 合子 的 Iota 版 与 原始 表达 式 是 否 等 价 一 点 都 不 明显 ， 因 此 我 们 可 以 通过 规约 
SKI 演算 内 部 的 每 一 个 组 合子 并 观察 它们 的 行为 来 进行 研究 。 下 面 是 在 我 们 把 5 转换 成 
Iota 然后 对 其 进行 规约 的 过 程 : 





>> expression = S.to iota 
=> 1[1[1[1[1]]]] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 








[CLII]]] 

ti[i [LiLSIIKI]]] 
tw[i[i[SISILKI[K]]]] 
tw[i[i[SIK]LKIK]]]]] 
iw[i[SIK]LKLK]]ESILK]]] 
LELK[S][KLK][S]][K]]] 
LELK[S][K][K]]] 
LiLS[K]]] 
+[S[K][S][K]] 
+[K[K][S[K]]] 

LK] 

K[S][K] 

S 


是 的 ，![LL LI]]] 实际 上 与 5 等 价 。 这 同样 也 适用 于 K: 


>> expression = K.to iota 
=> 1[1[1[1]]] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 





[II]] 
[LS][K]]] 
[ii[s[S][K][K]]] 
[is[K]IK[K]]]] 
t[s[K][K[K]][S][]] 
L[K[sS][K[K][S]][]] 
L[K[sS][K][K]] 
[SIK]] 
S[K][s][K] 
K[K][s[K]] 

K 

=> nil 











但 对 于 工 则 不 行 。! 规约 规则 只 会 产生 含有 5 和 kK 组 合子 的 表达 式 ， 因 此 不 可 能 以 字面 量 I 
结束 : 
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>> expression = I.to iota 
=> 1[1] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 


因此 S[K][K[K]] 在 语法 上 与 I 不 等 价 ， 但 它 是 sS 和 K 组 合子 表达 式 与 I 表达 式 做 同样 事情 
的 另 一 个 例子 : 


>> identity = SKICall.new(SKICall.new(S, K), SKICall.new(K, K)) 
=> SLKJ[LK[LK]] 
>> expression = SKICall.new(identity, x) 
=> S[Kj[K[K]][x] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 

SLK][KLK]]Lx] 
K[x][K[KJ[x]] 
K[x][K] 
区 
=> nil 


所 以 到 Iota 的 转换 虽然 没有 完全 保留 所 有 三 个 SKI 组 合子 的 语法 ， 但 确实 保留 了 它们 的 个 


体 和 


和 为。 我 们 可 以 通过 把 熟悉 的 lambda 演算 表达 式 用 它 的 SKI 演算 表示 转 成 Iota 来 测试 

















整体 的 效果 ， 然 后 对 其 求 值 以 检查 它 的 行为 : 


inc[inc[zero]] 是 我 们 所 期 望 的 结果 ， 因 此 Iota 表达 式 [Ei[i[i]]]][i[i[i[i[i]] 
LDL LI 


[ 


>> two 

=> ->p{t->xftppx] }} 

>> two.to_ski 

=> S[S[K[S]][S[K[K]][I]]][S[S[K[S]][S[K[K]][IJJIKII]] 


>> two.to ski.to iota 


=> Rt 
wel ILL ld 
J 1]]] 

>> expression = SKICall.new(SKICall.new(two.to ski.to iota, inc), zero) 

=> Et 
iL] 
J]EEti dE]]]i[linc] [zero] 

>> expression = expression.reduce while expression.reducible? 


=$ WL 
>> expression 
=> inc[inc[zero]] 

















] 
]] 





| 
[EEC ]]] 实际 是 一 个 对 ->p{->x{p[p[x]]}} 进行 无 





这 种 转换 ， 所 以 Iota 是 另 一 种 通用 语言 。 


7.5 ”标签 系统 


1]]] 


二 央 
里 、 


标签 系统 (tag system) 是 一 个 类 似 简 化 版 图 灵机 的 计算 模型 : 标签 系统 不 是 在 一 条 纸 带 上 
来 回 移动 纸 带头 ， 而 是 反复 在 一 个 字符 串 的 末尾 增加 新 的 字符 并 在 开头 处 移 除 字符 。 在 某 
方面 ， 标 签 系统 的 字符 串 像 是 图 灵机 的 纸 带 ， 但 标签 系统 被 限定 在 只 能 在 字符 串 的 两 头 操 





作 ， 而 且 它 只 能 朝 着 末尾 “移动 。 











标签 系统 的 描述 包括 两 部 分 : 首先 ， 一 个 规则 集合 ， 其 中 每 一 条 规则 定义 当 特定 的 字符 
出 现在 字符 串 的 开头 时 ， 要 给 这 个 字符 串 添加 的 一 些 字符 (例如 “字符 串 的 开头 是 字符 a 
时 ， 添 加 字符 bcd”) ， 其次， 一 个 叫 作 删除 数 的 数字 ， 它 定义 了 按照 一 个 规则 执行 之 后 有 





多 少 字符 要 从 字符 串 的 开头 删除 。 
下 面 是 一 个 标签 系统 的 例子 : 


。 字符 串 以 a 开头 时 ， 添 加 字符 bc; 
。 字符 串 以 b 开头 时 ,添加 字符 caad; 
。 字符 串 以 c 开头 时 ,添加 字符 ccd 








。 按照 上 面 的 任何 规则 执行 之 后 ， 从 字符 串 的 玫 








F 关 删除 三 个 字符 ， 换 句 话 说 ， 删 除数 是 3。 


我 们 可 以 通过 反复 遵照 规则 并 删除 字符 直到 字符 串 的 首 字符 没有 可 用 的 规则 ， 或 者 直到 字 
符 串 的 长 度 小 于 删除 数 "“， 以 此 来 执行 一 个 标签 系统 的 计算 。 我 们 用 初始 字符 串 'aaaaaa' 


来 运行 一 下 示例 标签 系统 : 


当前 字符 串 可 用 规则 





aaaaaa 字符 串 以 a 开 
aaabc 字符 串 以 a 开 
bcbc 字符 串 以 bp 开 

ccaad 字符 串 以 c 开 

adccd 字符 串 以 a 开 

cdbc 字符 串 以 < 开 

cccd 字符 串 以 c 开 











dccd 一 











头 时 ， 
头 时 ， 
头 时 ， 
头 时 ， 
头 时 ， 
头 时 ， 





添加 字符 bc 
添加 字符 bc 
添加 字符 caad 
添加 字符 ccd 
添加 字符 bc 
添加 字符 ccd 
添加 字符 ccd 


注 6: 第 二 个 条 件 可 以 防止 我 们 删除 比 字 符 串 所 含有 的 字符 数 还 多 的 字符 。 
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标签 系统 只 能 直接 在 字符 串 上 操作 ， 但 我 们 也 可 以 让 它们 对 其 他 类 型 的 值 (例如 数字 ) 执 
行 复杂 的 操作 ， 只 要 用 合适 的 方式 把 那些 值 编码 成 字符 串 就 行 。 对 数字 编码 的 一 种 可 能 

式 是 : 把 数字 mn 表示 成 字符 串 aa 后 跟 重复 n 次 的 字符 串 bb。 例 如 ， 把 数字 3 表示 成 字符 
串 aabbbbbb。 








硅 妆 


人 这 个 表示 的 某 些 方面 可 能 看 起 来 是 多 余 的 〈 可 以 只 是 把 3 表示 成 aaa) ， 但 很 
4 
lg 














4\ 4 、 快 你 就 会 发 现 ， 使 用 成 对 的 字符 ， 并 在 字符 串 的 开头 进行 明确 的 标记 很 
”有 用 。 





选 定 了 数字 的 编码 模式 ， 就 可 以 设计 标签 系统 操作 数字 了 。 下 面 是 一 个 对 输入 数 翻 倍 的 
系统 : 

。 字符 串 以 a 开头 时 ， 添 加 字符 aa; 

。 字符 串 以 bp 开头 时 ,添加 字符 bbbb， 

。 在 执行 完 一 个 规则 之 后 ， 从 字符 串 的 开头 删 掉 两 个 字符 (删除 数 为 2)。 














观察 一 下 起 始 字符 串 是 aabbbb 时 这 个 标签 系统 是 如 何 表现 的 ， 这 个 字符 串 表 示 2: 
aabbbb bbbbaa 

bbaabbbb 

aabbbbbbbb ( 表示 数字 4) 

bbbbbbbbaa 

bbbbbbaabbbb 

bbbbaabbbbbbbb 

bbaabbbbbbbbbbbb 

aabbbbbbbbbbbbbbbb ( 数字 8) 

bbbbbbbbbbbbbbbbaa 

bbbbbbbbbbbbbbaabbbb 


人 





很 明显 翻 倍 了 ， 但 这 个 标签 系统 却 永 远 运行 下 去 了 〈 把 由 当前 字符 串 表 示 的 数 翻 倍 ， 然 后 
再 翻 倍 ， 然 后 再 翻 倍 ) ， 这 真 不 是 我 们 想 要 的 。 为 了 设计 一 个 只 对 一 个 数字 翻 倍 一 次 然后 
停机 的 系统 ， 我 们 需要 使 用 不 同 的 字符 对 结果 进行 编码 ， 以 保证 不 再 触发 新 一 轮 的 翻 倍 。 
我 们 可 以 通过 放松 编码 模式 ， 允 许字 符 c 和 dd 替换 a 和 b， 然 后 修改 规则 ， 在 表示 翻 倍 之 
后 的 数 时 使 用 cc 和 dddd 而 不 是 aa 和 bbbb。 




















这 样 改变 之 后 ， 计 算 看 起 来 像 是 这 样 : 
aabbbb 一 bbbbcc 
一 bbccdddd 
一 ccdddddddd (数字 4， 用 < 和 d 而 不 是 a 和 进行 编码 ) 


修改 后 的 系统 在 到 达 ccdddddddd 时 会 停止 ， 因 为 没有 针对 c 开头 字符 串 的 规则 。 






































在 这 种 情况 下 ， 我 们 只 是 依赖 字符 c 适时 停止 计算 ， 因 此 完全 可 以 在 结果 中 
重用 b 而 不 是 用 d 来 替换 它 ， 但 使 用 超出 必要 的 字符 没有 什么 害处 。 

















使 用 不 同 的 字符 集合 来 对 输入 和 输出 值 进行 编码 会 更 清晰 一 些 。 就 像 我 们 很 
快 将 要 看 到 的 那样 ， 这 还 能 更 容易 地 把 几 个 小 的 标签 系统 组 合成 一 个 大 的 系 
统 ， 可 以 通过 把 一 个 系统 的 输出 编码 与 另 一 个 系统 的 输入 编码 匹配 做 到 。 























为 了 在 Ruby 中 模拟 标签 系统 ， 我 们 需要 一 个 单 规则 的 实现 (TagRule)， 一 个 规则 集合 的 
实现 (TagRulebook)， 以 及 标签 系统 自身 的 实现 (TagSystem) : 





class TagRule < Struct.new(:first character, :append characters) 
def applies to?(string) 
string.chars.first == first character 
end 


def follow(string) 
string + append_ characters 
end 
end 


class TagRulebook < Struct.new(:deletion number, :rules) 
def next_ string(string) 
rule for(string).follow(string).slice(deletion number..-1) 
end 


def rule for(string) 
rules.detect { |r| r.applies to?(string) } 
end 
end 


class TagSystem < Struct.new(:current string, :rulebook) 


def step 
self.current string = rulebook.next string(current string) 
end 
end 
这 个 实现 允许 我 们 单 步 执行 标签 系统 的 计算 ， 一 次 只 执行 一 个 规则 。 让 我 们 试 试 之 前 的 对 


数字 翻 倍 的 例子 ， 这 次 对 数字 3 (aabbbbbb) 翻 倍 : 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'aa'), TagRule.new('b', 'bbbb')]) 
=> #<struct TagRulebook ...> 
>> System = TagSystem.new('aabbbbbb' , rulebook) 
=> #<struct TagSystem ...> 
>> 4.times do 

puts system.current string 

system. step 

end; puts system.current string 

aabbbbbb 
bbbbbbaa 
bbbbaabbbb 
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bbaabbbbbbbb 
aabbbbbbbbbbbb 
= 而 这 


因为 这 个 标签 系统 会 永远 运行 ， 所 以 我 们 只 能 在 结果 出 现 之 前 预先 知道 执行 多 少 步 (这 种 
情况 下 是 4 步 )， 但 如 果 我 们 使 用 把 结果 用 c 和 d 编码 的 修改 版 本 ， 就 可 以 让 它 自 动 停 下 
来 。 增 加 代码 来 支持 它 : 

















class TagRulebook 
def applies to?(string) 
lrule for(string).nil? && string.length >= deletion number 
end 
end 


class TagSystem 
def run 
while rulebook.applies to?(current string) 
puts current string 
step 
end 


puts current string 
end 
end 


现在 可 以 只 对 标签 系统 的 停机 版 本 调用 TagSystem#run， 并 让 其 在 合适 时 机 自然 停止 : 


这 个 


执行 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'cc'), TagRule.new('b', 'dddd')]) 
=> #<struct TagRulebook ...> 

>> system = TagSystem.new( "aabbbbbb' , rulebook) 
=> #<struct TagSystem ...> 

>> system.run 

aabbbbbb 

bbbbbbcc 

bbbbccdddd 

bbccdddddddd 

ccdddddddddddd 

=> nil 








实现 允许 我 们 探索 标签 系统 能 做 的 其 他 事情 。 使 用 我 们 的 编码 模式 ， 很 容易 设计 系统 





其 他 的 数字 操作 ， 就 像 下 面 这 个 对 一 个 数字 减 半 的 系统 : 











>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'cc'), TagRule.new('b', 'd')]) 
=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbbbbbbbbbb' , rulebook) 

=> #<struct TagSystem ...> 

>> system.run 

aabbbbbbbbbbbb 

bbbbbbbbbbbbcc 

bbbbbbbbbbccd 

bbbbbbbbccdd 

bbbbbbccddd 
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bbbbccdddd 
bbccddddd 
ccdddddd 
=> nil 


还 有 这 个 递增 一 个 数字 的 系统 : 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'ccdd'), TagRule.new('b', 'dd')]) 
=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb', rulebook) 

=> #<struct TagSystem ...> 

>> system.run 

aabbbb 

bbbbccdd 

bbccdddd 

ccdddddd 

=> nil 


我 们 可 以 把 两 个 标签 系统 联结 一 起 ， 只 要 第 一 个 系统 的 输出 编码 与 第 二 个 系统 的 输入 编码 
匹配 即 可 。 下 面 是 一 个 简单 的 系统 ， 它 使 用 字符 c 和 dd 对 递增 规则 的 输入 进行 编码 ， 并 用 
e 和 上 对 它们 的 输出 进行 编码 ， 以 此 把 翻 倍 和 递增 规则 组 合 到 一 起 : 


>> rulebook = TagRulebook.new(2, [ 
TagRule.new('a', 'cc'), TagRule.new('b', 'dddd'), # double 
TagRule.new('c', 'eeff'), TagRule.new('d', 'ff') # increment 

]) 

=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb' , rulebook) 

=> #<struct TagSystem ...> 

>> system.run 

aabbbb ( 数字 2) 

bbbbcc 

bbccdddd 

ccdddddddd (数字 4) @ 

ddddddddeeff 

ddddddeeffff 

ddddeeffffff 

ddeeffffffff 

eeffffffffff (数字 5) 四 

=> nil 


@ 翻 倍 规则 把 2 转 成 4， 用 字符 c 和 d 编码 。 
@ 递增 规则 把 4 转 成 5， 这 次 使 用 e 和 上 编码 。 


除了 把 数字 转 成 其 他 数字 之 外 ， 标 签 系统 还 可 以 检查 它们 的 数学 特性 。 下 面 是 测试 一 个 数 
是 奇数 还 是 偶数 的 标签 系统 : 


>> rulebook = TagRulebook.new(2，[ 
TagRule.new('a', 'cc'), TagRule.new('b', 'd'), 
TagRule.new('c', 'eo'), TagRule.new('d', ''), 
TagRule.new('e', 'e') 
]) 


=> #<struct TagRulebook ...> 
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如 果 输 入 代表 一 个 偶数 ， 这 个 系统 会 停止 在 单字 符 e〈 代 表 “ 偶 数 ") : 


>> System = TagSystem.new( "aabbbbbbbb' , rulebook) 
=> #<struct TagSystem ...> 

>> system.run 

aabbbbbbbb (the number 4) 

bbbbbbbbcc 

bbbbbbccd 

bbbbccdd 


@a 和 b 把 输入 减 半 ，ccdddd 代表 数字 2。 

@c 规则 删 掉 前 导 的 cc 对 ， 并 添加 字符 eo， 它 们 中 间 的 一 个 会 形成 最 后 的 结果 。 
@ 空 的 4 规则 会 耗 尽 所 有 的 前 导 dd 对 ， 只 留 下 eo。 

@e 规则 只 会 用 e 替换 seo， 然后 系统 停机 。 


如 果 输 入 的 数 为 奇数 ， 那 么 结果 就 是 字符 串 o (代表 “奇数 ") : 


>> System = TagSystem.new('aabbbbbbbbbb' , rulebook) 
=> #<struct TagSystem ...> 
>> system.run 

aabbbbbbbbbb ( 数字 5) 
bbbbbbbbbbcc 

bbbbbbbbccd 

bbbbbbccdd 

bbbbccddd 

bbccdddd 

ccddddd @ 

dddddeo 


@ 数字 像 以 前 一 样 减 半 ， 但 因为 这 次 是 奇数 ， 所 以 结果 是 一 个 奇数 个 d 组 成 的 字符 串 。 我 
们 对 数字 的 编码 模式 只 使 用 成 对 的 字符 ， 因 此 ccddddd 不 代表 任何 数 ， 但 因为 它 含 有 
“两 个 半 ” 成 对 的 字符 d， 可 以 不 正式 地 把 它 看 成 是 数字 2.5。 

@ 所 有 前 导 的 dd 对 都 被 铀 掉 了 ， 在 最 终 的 eo 之 前 留 下 了 一 个 d。 

全 残留 的 d 被 删 掉 了 ， 并 带 走 了 e， 只 留 下 0， 然后 系统 停机 。 











为 了 让 这 个 标签 系统 工作 ， 拥 有 大 于 1 的 删除 数 至 关 重 要 。 因 为 每 个 第 二 字 
4 ， 符 都 会 触发 一 个 规则 ， 我 们 可 以 通过 在 特定 的 触发 位 置 安排 特定 的 字符 出 现 

全 (或 者 不 出 现 ) 来 影响 系统 的 行为 。 这 种 让 字符 在 删除 行为 中 同步 或 者 不 同 
步 出 现 的 技术 是 设计 强大 标签 系统 的 关键 。 
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这 些 数字 操作 技术 可 以 用 来 模拟 一 台 图 灵机 。 在 像 标 签 系统 这 么 简单 的 东西 之 上 构建 模拟 
em 


(1) 作为 可 能 最 简单 的 例子 ， 让 一 台 图 灵机 的 纸 带 只 使 用 两 个 字符 ， 我 们 将 称 它们 为 0 和 
1， 甚 中 0 扮演 空白 字符 的 角色 。 

@Q2) 把 图 灵机 的 纸 带 分 成 两 部 分 : 左 半 部 分 含有 纸 带 头 下 的 字符 和 所 有 它 左 边 的 字符 ， 布 
半 部 分 含有 纸 带 头 右边 的 所 有 字符 。 

(G3) 把 纸 带 的 左 半 部 分 作为 一 个 二 进 制 数 : 如 果 最 初 的 纸 带 类 似 0001101(0)0011000， 那 么 
左 半 部 分 就 是 二 进 制 数 11010， 这 是 十 进 制 数 26。 

(4) 把 纸 带 的 右 半 部 分 作为 一 个 反 写 的 二 进 制 数 : 示例 纸 带 的 右 半 部 分 是 二 进 制 数 1100， 
即 十 进 制 数 12。 

(5) 把 这 两 个 数 编码 成 一 个 适合 由 标签 系统 使 用 的 字符 串 。 对 于 示例 纸 带 ， 我 们 可 以 使 用 
aa 后 跟 26 份 bb， 然 后 cc 后 跟 12 份 dd。 

(6) 使 用 简单 的 翻 倍 、 减 半 、 递 增 、 递 减 ， 以 及 奇偶 检查 模拟 从 纸 带 上 读 、 向 纸 带 写 以 及 
移动 纸 带 头 。 例 如 ， 我 们 通过 对 左 半 部 分 数字 翻 倍 ， 对 右 半 部 分 数字 减 半 “来 在 示例 纸 

带 上 向 右 移动 纸 带 头 : 翻 倍 26 得 到 52， 二 进 制 就 是 110100;， 12 的 一 半 是 6， 二 进 制 
是 110。 因 此 新 的 纸 带 看 起 来 是 011010(0)011000。 从 纸 带 上 读 取 意 味 着 检查 表示 纸 带 
左 半 部 分 的 数字 是 奇数 还 是 偶数 ， 而 向 纸 带 上 写 一 个 1 或 者 0 意思 是 对 那个 数 递增 或 者 

(7) 使 用 选择 的 字符 来 对 左右 纸 带 数 进行 编码 ， 以 此 来 表示 所 模拟 图 灵机 的 当前 状态 : 或 
许 机 器 处 于 状态 1， 我 们 使 用 a、b、c 和 d 来 对 纸 带 进行 编码 ， 但 它 转移 到 状态 2 时 ， 
使 用 e、f、g 和 h 来 编码 ， 以 此 类 推 。 

(8) 把 每 一 个 图 灵机 规则 转 成 一 个 标签 系统 ， 它 会 用 ee 
取 一 个 0， 写 入 一 个 1， 向 右 移动 纸 带 头 并 进入 状态 2 的 规则 变 成 的 标签 系统 ， 区 
左 侧 纸 带 的 数 是 偶数 ， 对 其 递增 ， 翻 倍 左边 纸 带 的 数 ， 同时 减 半 右边 纸 带 的 数 ， 然后 
产生 一 个 使 用 状态 2 的 字符 编码 的 字符 串 。 

(9) 把 这 些 独立 的 标签 系统 组 合 起 来 ， 就 是 一 个 可 以 模拟 图 灵机 每 一 条 规则 的 大 系统 

































































六 


对 于 标签 系统 如 何 模拟 图 灵机 工作 的 完整 说 明 ， 请 看 Matthew Cook 在 http:// 
4 ，www.complex-systems.com/pdf/15-1-1.pdf 中 2.1 节 所 做 的 简洁 解释 。 


， 
4 人 











Cook 的 模拟 比 这 里 描述 的 更 复杂 。 它 使 用 当前 字符 串 的 “对 齐 ” 来 表示 所 
模拟 纸 带 头 下 面 的 字符 ， 而 不 是 把 它 作 为 纸 带 的 一 部 分 ， 而 且 它 很 容易 扩 
展 ， 通 过 增加 标签 系统 的 删除 数 来 以 任意 数目 的 字符 模拟 一 台 图 灵机 。 






































标签 系统 可 以 模拟 任意 图 灵机 的 事实 ， 意 味 着 它 也 是 通用 的 。 











注 7: 对 一 个 数 翻 倍 在 二 进 制 表 示 上 就 是 所 有 的 数字 左 移 一 位 ， 而 减 半 就 是 把 所 有 的 数字 右 移 一 位 。 
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7.6 ”循环 标签 系统 


循环 标签 系统 cyclic tag system) 是 施加 了 一 些 额 外 限制 的 更 简单 的 标签 系统 。 





。 循环 标签 系统 的 字符 串 只 能 包含 两 个 字符 : 0 和 1。 
。 循环 标签 系统 的 规则 只 会 在 当前 字符 串 以 1 开始 而 不 是 0 开始 的 时 候 才 会 应 用 。- 
。 循环 标签 系统 的 删除 数 总 是 1。 


这 些 约束 本 身 对 于 支持 任何 有 用 的 计算 来 说 都 过 于 苛刻 了 ， 因 此 作为 补偿 循环 标签 系统 有 
一 个 额外 的 特性 : 循环 标签 系统 的 规则 手册 中 的 第 一 条 规则 是 执行 开始 时 的 当前 规则 ， 并 
且 在 计算 的 每 一 步 之 后 ， 规 则 手册 中 的 下 一 个 规则 就 成 为 了 当前 规则 ， 在 到 达 规 则 手册 结 
尾 的 时 候 又 会 回 到 第 一 个 规则 。 








下 

















这 种 系统 被 称 为 “循环 的 "， 是 因为 当前 规则 不 断 地 在 规则 手册 中 循环 。 一 个 当前 规则 ， 
再 结合 上 每 条 规则 都 只 会 应 用 到 1 开头 的 字符 串 这 一 约束 ， 避 免 了 在 每 一 步 执行 中 不 得 不 
遍历 规则 手册 查找 可 用 规则 的 开销 。 如 果 首 字符 是 1， 那 么 就 应 用 当前 规则 ， 否 则 ， 就 疫 
有 可 用 的 规则 。 





作为 一 个 例子 ， 我们 看 一 下 拥有 三 个 规则 的 循环 标签 系统 ， 三 个 规则 分 别 添加 字符 1， 
0010 和 10。 下 面 是 以 字符 串 11 开始 时 的 情形 : 




















当前 字符 串 当前 规则 可 以 应 用 规则 吗 

11 添加 字符 1 是 
11 添加 字符 0010 是 
10010 添加 字符 10 是 
001010 添加 字符 1 否 
01010 添加 字符 0010 否 
1010 添加 字符 10 是 
01010 添加 字符 1 否 
1010 添加 字符 0010 是 
0100010 添加 字符 10 否 
100010 添加 字符 1 是 
000101 添加 字符 0010 否 
00101 添加 字符 10 否 
0101 添加 字符 1 否 
101 添加 字符 0010 是 
010010 添加 字符 10 否 
10010 添加 字符 1 是 
00101 添加 字符 0010 否 

注 8: 循环 标签 系统 的 规则 没有 必要 说 “字符 串 以 1 开始 时 ， 添 加 字符 011”， 因 为 第 一 部 分 已 经 假定 了 一 一 

















只 需要 “添加 字符 011” 就 足够 了 。 
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尽管 这 个 系统 极其 简单 ， 我 们 也 能 看 到 一 点 点 复杂 的 行为 : 接 下 来 要 发 生 什么 并 不 明显 。 
稍微 思考 一 下 ， 可 以 证 明 这 个 系统 将 会 永远 运行 下 去 而 不 是 缩减 成 一 个 空 字符 串 ， 这 是 因 
为 每 个 规则 都 添加 一 个 1， 因 此 只 要 最 初 的 字符 串 含 有 一 个 1， 它 就 不 会 完全 结束 。" 但 是 
当前 字符 串 会 断断续续 地 持续 变 长 ， 还 是 会 进入 扩张 和 收缩 的 反复 模式 呢 ? 只 看 规则 设法 
回答 这 个 问题 ， 需 要 一 直 运行 这 个 系统 以 查 明 会 发 生 什么 。 








我 们 已 经 有 了 常见 标签 系统 的 一 个 Ruby 实现， 因此 模拟 循环 标签 系统 不 需要 大 多 的 额外 
工作 。 我 们 通过 简单 的 子 类 化 TagRule 实现 CyclicTagRule 并 把 '1' 硬 编码 为 它 的 first_ 
character: 


class CyclicTagRule < TagRule 
FIRST_CHARACTER = "1" 


def initialize(append characters) 
super(FIRST_ CHARACTER, append characters) 
end 


def inspect 
"#<CyclicTagRule #{append characters.inspect}>" 
end 


end 


#initialize 是 一 个 构造 方法 ， 在 一 个 类 的 实例 被 创建 时 会 自动 调用 。 
CyclicTagRule#initialize 从 超 类 TagRule 调用 构造 函数 ,以 此 来 设置 first_ 
:character 和 append_character 属性 。 











循环 标签 系统 的 规则 工作 方式 有 些许 的 不 同 ， 因 此 我 们 将 从 头 构建 一 个 CylicTagRulebook 
类 ， 提 供 对 #applies_to? 和 #next_string 的 新 实现 : 





class CyclicTagRulebook < Struct.new(:rules) 
DELETION NUMBER = 1 


def initialize(rules) 
super(rules.cycle) 
end 


def applies to?(string) 
string.length >= DELETION NUMBER 
end 


def next string(string) 
follow next rule(string).slice(DELETION NUMBER..-1) 
end 











注 9: 循环 标签 系统 与 正常 的 标签 系统 不 同 ， 它 在 没有 规则 可 用 的 时 候 仍然 会 一 直 运行 ， 不 然 的 话 它 就 什么 
也 做 不 了 。 让 循环 标签 系统 停止 运行 的 唯一 方式 就 是 使 它 的 当前 字符 串 成 为 空 。 例 如 在 初始 字符 串 完 
全 由 字符 0 组 成 的 时 候 ， 总 会 出 现 空 字符 串 。 
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def follow next rule(string) 
rule = rules.next 


if rule.applies to?(string) 
rule.follow(string) 
else 
string 
end 
end 
end 


不 像 TagRulebook， 即 使 当前 规则 不 能 应 用 ，CyclicTagRulebook 也 总 是 应 用 到 非 空 字符 
串 上 。 








Array#cycle 创建 一 个 Enumerator (参见 6.1.11 节 “ 原 始 Ruby 流 ” 部 分 )， 
。 它 会 永远 地 循环 访问 一 个 数组 的 元 素 : 


>> numbers = [1, 2, 3].cycle 

=> #<Enumerator: [1, 2, 3]:cycle> 
>> numbers.next 

=> 1 

>> numbers.next 

= 2 

>> numbers.next 

=> 3 

>> numbers.next 

=> 1 

>> [:a, :b, :c, :d].cycle.take(10 
sy [a 3b ses Sd 29 3b Se Sds and] 


这 恰好 是 我 们 对 循环 标签 系统 当前 规则 所 要 求 的 行为 因此 
CyclicTagRulebook#initialize 把 这 些 循环 中 的 一 个 赋 给 规则 属性 ， 然 后 每 
次 对 #follow_next_rule 的 调用 都 使 用 rules.next 得 到 循环 中 的 下 一 条 规则 。 








现在 我 们 可 以 创建 由 CyclicTagRules 组 成 的 CyclicTagRulebook， 然 后 把 它 放 到 一 个 
TagSystem 里 观察 其 工作 情况 : 








>> rulebook = CyclicTagRulebook.new([ 
CyclicTagRule.new('1'), CyclicTagRule.new('0010'), CyclicTagRule.new('10') 
]) 
=> #<struct CyclicTagRulebook ...> 
>> System = TagSystem.new('11', rulebook) 
=> #<struct TagSystem ...> 
>> 16.times do 
puts system.current string 
system. step 
end; puts system.current string 
11 
条 
10010 
001010 





01010 
1010 
01010 
1010 
0100010 
100010 
000101 
00101 
0101 
101 
010010 
10010 
00101 
=> nil 


这 与 我 们 手工 单 步 执行 时 候 看 到 的 行为 相同 。 继 续 吧 : 


>> 20.times do 
puts system.current string 
system. step 
end; puts system.current string 
00101 


101 
010010 
10010 
00101 
0101 
101 
011 

11 

110 
101 
010010 
10010 
00101 
0101 
101 

=> nil 





以 字符 串 11 开始 时 ， 这 个 系统 确实 进入 到 重复 的 行为 中 : 在 一 段 不 稳定 阶段 过 后 ， 会 出 
现 9 个 连续 的 字符 串 (101、010010、10010、00101……) 并 会 一 直 这 么 重复 下 去 。 当 然 ， 
如 果 我 们 改变 了 初始 字符 串 或 者 任意 规则 ， 那 长 期 的 行为 都 会 变 得 不 同 。 








循环 标签 系统 极其 受 限 (它们 的 规则 不 灵活 ， 只 有 两 个 字符 ， 删 除数 也 是 最 低 值 )， 但 令 
人 吃惊 的 是 ， 仍 然 可 以 使 用 它们 模拟 任何 标签 系统 。 


由 一 个 循环 标签 系统 对 一 个 正常 标签 系统 的 模拟 大 概 像 下 面 描述 的 这 样 工作 。 
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(1) 决定 标签 系统 的 字母 表 : 它 使 用 的 字符 集合 。 

(2) 设计 编码 模式 ， 把 每 一 个 字符 与 一 个 适合 用 在 循环 标签 系统 里 的 唯一 字符 串 关 联 起 来 
(也 就 是 只 包含 0 和 1)。 

(3) 把 每 一 个 原始 系统 的 规则 转换 成 一 个 循环 标签 系统 的 规则 ， 方 法 是 对 它 添 加 的 字符 进 
行 编码 。 

(4) 用 空 规则 填补 循环 标签 系统 的 规则 手册 ， 模 拟 原始 标签 系统 的 删除 数 。 

(5) 对 原始 标签 系统 的 输入 字符 串 进 行 编码 ， 并 使 用 它 作为 循环 标签 系统 的 输入 。 


下 面 就 来 具体 实现 上 述 思 路 。 首 先 ， 需 要 能 得 到 一 个 标签 系统 所 使 用 的 字符 : 














class TagRu]e 
def alphabet 
([first character] + append characters.chars.entries).uniq 
end 
end 


class TagRulebook 
def alphabet 
rules.flat map(&:alphabet).uniq 
end 
end 


class TagSystem 
def alphabet 
(rulebook.alphabet + current string.chars.entries).uniq.sort 
end 
end 


我 们 可 以 在 7.5 节 数 字 递 增 的 标签 系统 上 测试 这 个 功能 。Tagsystem#alphabet 表明 这 个 系 
统 使 用 字符 a、b、c 和 d: 

>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'ccdd'), TagRule.new('b', 'dd')]) 

=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb' , rulebook) 

=> #<struct TagSystem ...> 

>> system.alphabet 

=> ["a", "bb" ve "d"] 
下 一 步 ， 我 们 需要 把 每 个 字符 编码 成 循环 标签 系统 能 使 用 的 字符 串 。 能 让 模拟 工作 的 具体 
编码 模式 是 : 每 个 字符 都 表示 成 一 个 0 组 成 的 字符 串 ， 其 长 度 与 字母 表 相 同 ， 只 是 在 某 个 
位 置 上 有 一 个 1 反映 字符 在 字母 表 中 的 位 置 。” 


标签 系统 字母 表 里 有 4 个 字符 ， 所 以 每 个 字符 都 编码 成 4 个 字符 组 成 的 字符 串 ， 在 不 同 的 
位 置 放 上 1; 











注 10: 0 和 1 的 结果 序列 并 不 是 二 进 制 数 ， 只 是 含有 一 个 1 标识 特定 位 置 的 0 组 成 的 字符 串 。 
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标签 系统 字符 在 字母 表 中 的 位 置 编码 表示 





a 0 1000 
b 1 0100 
4 0010 
3 0001 


为 了 实现 这 个 编码 模式 ， 我 们 将 引入 CyclicTagEncoder， 它 可 以 由 一 个 特定 的 字母 表 构 造 


出 来 ， 然 后 对 字母 表 中 的 字母 进行 编码 : 


class CyclicTagEncoder < Struct.new(:alphabet) 
def encode string(string) 
string.chars.map { |character| encode character(character) }.join 
end 


def encode character(character) 
character position = alphabet.index(character) 
(0...alphabet.length).map { |n| n == character position ? '1 
end 
end 


: '0' }.join 


class TagSystem 
def encoder 
CyclicTagEncoder.new(alphabet) 
end 
end 


现在 可 以 使 用 标签 系统 的 CyclicTagEncoder 对 由 a、b、c 和 组 成 的 任意 字符 串 进 行 级 





码 了 : 


>> encoder = System.encodeT 

=> #<struct CyclicTagEncoder alphabet=["a", "b", "c", "d"]> 
>> encoder.encode character('c') 

=> "0010" 

>> encoder.encode string('cab') 

=> "001010000100" 








使 用 这 个 编码 器 ， 我 们 可 以 把 每 个 标签 系统 规则 转换 成 对 应 的 循环 标签 系统 规则 。 我 们 只 是 对 





TagRule 的 append_characters 进行 编码 ， 然 后 使 用 结果 字符 串 构建 一 个 CyclicTagRule: 


class TagRule 
def to cyclic(encoder) 
CyclicTagRule.new(encoder.encode string(append characters)) 
end 
end 


在 一 个 TagRule 上 试 一 下 : 





>> rule = system.rulebook.rules.first 
=> #<struct TagRule first character="a", append characters="ccdd"> 
>> rule.to_ cyclic(encoder) 


=> #<CyclicTagRule "0010001000010001"> 
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好 ，append characters 已 经 被 转换 了 ， 但 现在 我 们 已 经 失去 了 关于 哪个 first_character 应 该 触 
发 规则 的 信息 一 一 不 管 它 由 哪个 TagRule 转换 而 来 ， 每 一 个 first_character 都 会 被 字符 1 
触发 。 


此 时 ， 该 信息 由 循环 标签 系统 里 规则 的 顺序 传达 : 第 一 个 规则 针对 字母 表 中 的 第 一 个 字 
符 ， 第 二 个 规则 针对 第 二 个 字符 ， 以 此 类 推 。 任 何在 标签 系统 中 没有 对 应 规则 的 字符 都 会 
在 循环 标签 系统 中 得 到 一 个 空 规 则 。 








我 们 可 以 实现 一 个 TagRulebook#cyclic_rules 方法 返回 按照 正确 顺序 排列 的 转换 后 的 规则 : 


class TagRulebook 
def cyclic rules(encoder) 
encoder.alphabet.map { |character| cyclic rule for(character, encoder) } 
end 


def cyclic rule for(character, encoder) 
rule = rule for(character) 


if rule.nil? 
CyclicTagRule.new('') 
else 
rule.to cyclic(encoder) 
end 
end 
end 





可 


看 是 #cyclic_rules 为 我 们 的 标签 系统 产生 的 规则 : 











>> system.rulebook.cyclic rules(encoder) 
=> [ 
#<CyclicTagRule "0010001000010001">，, 
#<CyclicTagRule "00010001" >， 


#<CyclicTagRule "">, 


nn 


#<CyclicTagRule ""> 
] 





转换 后 的 a 和 b 规则 首先 出 现 ， 后 边 在 < 和 dd 的 位 置 上 跟着 两 个 空白 规则 。 


这 个 结果 与 模拟 工作 所 依托 的 字符 编码 模式 相 吻 合 。 例 如 ， 如 果 模 拟 的 标签 系统 的 输入 字 
符 串 是 单独 的 一 个 字符 b， 在 循环 标签 系统 的 输入 字符 串 中 将 出 现 0100。 以 下 是 系统 在 运 
行 这 个 输入 时 的 情况 : 











当前 字符 串 当前 规则 规则 可 以 应 用 吗 
0100 添加 字符 0010001000010001 (a 规则 ) 否 
100 添加 字符 00010001 (b 规则 ) 是 
0000010001 什么 都 不 添加 (c 规则 ) 否 
否 


000010001 什么 都 不 添加 (d 规则 ) 








在 计算 的 第 一 步 ， 当 前 规则 是 转换 后 的 a 规则 ， 并 且 因 为 当前 字符 串 以 0 开始 ， 所 以 当前 
规则 不 会 应 用 。 但 在 第 二 步 ， 随 着 前 导 的 0 从 当前 字符 串 中 被 删除 ，b 规则 成 为 当前 规则 ， 
同时 暴露 出 一 个 前 导 的 1， 它 将 触发 规则 应 用 。 下 两 个 字符 都 是 0， 因 此 < 和 dd 规则 都 不 会 
用 到 。 











可 见 ， 通 过 小 心安 排 输入 字符 串 中 字符 1 的 出 现时 间 ， 以 便 与 循环 标签 系统 规则 出 现 的 周 
期 一 致 ， 我 们 可 以 在 合适 的 时 间 触 发 合适 的 规则 ， 完 美 地 模拟 常见 标签 系统 规则 的 字符 匹 


最 后 ， 我 们 需要 模拟 原始 标签 系统 的 删除 数 。 这 可 以 通过 向 循环 标签 系统 的 规则 手册 中 
插入 额外 的 空 规 则 来 完成 ， 以 便 在 一 个 字符 被 成 功 处 理 后 删除 合适 数量 的 字符 。 如 果 原 
始 的 标签 系统 在 其 字母 表 中 有 n 个 字符 ， 那 么 原始 系统 字符 串 的 每 一 个 字符 都 表示 为 循 
环 标签 系统 字符 串 中 的 mn 个 字符 ， 因 此 对 于 每 个 增加 的 想 要 删除 的 模拟 字符 ， 需 要 n 个 
空 规则 : 

















class TagRulebook 
def cyclic padding rules(encoder) 
Array.new(encoder.alphabet.length, CyclicTagRule.new('')) * (deletion number - 1) 
end 
end 


标签 系统 的 字母 表 里 有 4 个 字符 ， 删 除数 是 2， 因 此 除了 已 经 被 转换 后 规则 删 掉 的 字符 之 
外 ， 我 们 还 需要 4 个 空 规则 以 出 掉 一 个 模拟 的 字符 ; 


>> system.rulebook.cyclic padding rules(encoder) 
三 5 
#<CyclicTagRule "">, 
#<CyclicTagRule "">, 
#<CyclicTagRule "">, 
#<CyclicTagRule ""> 
] 


现在 我 们 可 以 把 所 有 东西 都 放 到 一 起 来 为 TagRulebook 实现 一 个 完整 的 批 o_cyclic 方法 ， 
然后 在 TagSystem#to_cyclic 方法 中 使 用 它 ， 把 规则 手册 和 当前 字符 串 都 转换 成 一 个 完整 
的 循环 标签 系统 : 


class TagRulebook 
def to cyclic(encoder) 
CyclicTagRulebook.new(cyclic rules(encoder) + cyclic padding rules(encoder)) 
end 
end 


class TagSystem 
def to cyclic 
TagSystem.new(encoder.encode string(current string), rulebook.to cyclic(encoder)) 
end 
end 
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是 我 们 转换 数字 递增 标签 系统 并 运行 时 所 发 生 的 : 


7 
TI 











>> cyclic system = system.to cyclic 

=> #<struct TagSystem ...> 

>> cyclic_system.run 

100010000100010001000100 (aabbbb) @ 
000100001000100010001000010001000010001 
00100001000100010001000010001000010001 
0100001000100010001000010001000010001 
100001000100010001000010001000010001 (abbbbccdd) 四 
00001000100010001000010001000010001 
0001000100010001000010001000010001 
001000100010001000010001000010001 
01000100010001000010001000010001 (bbbbccdd) © 
1000100010001000010001000010001 @ 
00010001000100001000100001000100010001 
0010001000100001000100001000100010001 
010001000100001000100001000100010001 (bbbccdddd) 
10001000100001000100001000100010001 
0001000100001000100001000100010001 
001000100001000100001000100010001 
01000100001000100001000100010001 (bbccdddd) 
1000100001000100001000100010001 @ 
00010000100010000100010001000100010001 
0010000100010000100010001000100010001 
010000100010000100010001000100010001 (bccdddddd) 
10000100010000100010001000100010001 
0000100010000100010001000100010001 
000100010000100010001000100010001 
00100010000100010001000100010001 (ccdddddd) @ 
0100010000100010001000100010001 
100010000100010001000100010001 
00010000100010001000100010001 @ 


E> 


@ 标签 系统 的 编码 后 版 本 的 a 规则 在 这 里 。 

@ 模拟 字符 串 的 第 一 个 完整 字符 已 经 被 处 理 了 ， 因 此 下 面 的 4 步 使 用 空 规则 删除 接 下 来 所 
模拟 的 字符 。 

图 经 过 循环 标签 系统 的 8 步 之 后 ， 所 模拟 的 标签 系统 完成 了 完整 一 步 。 

@ 编码 后 的 bp 规则 在 这 里 触发 了 …… 

@ ee 这 里 又 一 次 。 

@@ 循环 标签 系统 计算 24 步 了 ， 而 我 们 到 达 了 所 模拟 标签 系统 最 终 字 符 串 的 表示 : 
ccdddddd 。 

@ 所 模拟 的 标签 系统 对 于 c 或 者 d 开头 的 字符 串 没有 规则 ， 因 此 循环 标签 系统 的 当前 字符 
串 持 续 变 得 越 来 越 短 ……: 
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@ … 直到 变 成 空 字符 申 ， 然 后 系统 停机 。 


这 个 技术 可 以 用 来 模拟 任何 标签 系统 ， 包 括 本 身 已 经 模拟 了 一 台 图 灵机 的 标签 系统 。 这 意 
味 着 循环 标签 系统 也 是 通用 的 。 


7.7 ” Conway 的 生命 游戏 


1970 年 ，John Conway 发 明了 一 个 叫 作 生命 游戏 (Game of Life) 的 通用 系统 。 “游戏” 要 在 
一 个 无 限 多 的 二 维 网 格 里 进行 ， 网 格 的 每 个 小 方 格 可 以 是 生 或 是 死 。 一 个 小 方 格 有 8 个 邻 
居 : 它 上 面 的 三 个 单元 ， 紧 挨 着 它 的 左右 两 个 单元 ， 以 及 它 下 面 的 三 个 单元 。 


生命 游戏 像 有 限 状态 机 那样 分 一 系列 步骤 进行 。 在 每 一 步 ， 根 据 由 这 个 单元 自身 的 当前 状 
态 和 它 邻 居 的 状态 所 触发 的 规则 ， 每 个 单元 都 可 能 从 生 转 变 为 死 ， 或 者 相反 。 规 则 很 简 
单 : 如 果 一 个 活着 的 单元 有 少 于 两 个 (人口 稀 少 ) 或 者 多 于 三 个 (人口 过 剩 ) 活着 的 邻 
居 ， 它 就 会 死 掉 ， 如 果 一 个 死 的 单元 恰好 有 三 个 活着 的 邻居 它 就 能 复活 (繁殖 )。 


下 面 是 生命 游戏 规则 如 何 通 过 一 步 的 进程 来 影响 一 个 单元 状态 的 6 个 例子 “， 生 的 单元 用 
黑色 表示 ， 死 的 单元 用 白色 表示 : 
























































中 





CEP 




















一] 像 这 样 的 一 个 系统 ， 称 为 细胞 自动 机 ， 包 括 一 个 单元 组 成 的 数组 和 在 每 一 步 
QS 4 、 更 新 一 个 单元 状态 的 规则 集合 。 

0 

就 像 本 章 我 们 已 经 看 到 的 其 他 系统 一 样 ， 尽 管 规 则 简单 ， 但 生命 游戏 展示 了 出 平 意料 的 复 
杂 性 。 特 定 模式 的 生 的 单元 会 出 现 有 趣 的 行为 ， 其 中 最 著名 的 就 是 滑翔 机 (glider) ， 这 是 
一 个 5 个 生 单元 的 组 合 ， 每 经 过 4 步 它 们 就 会 沿 对 角 线 移动 一 个 方 格 : 





























注 11: 512 种 可 能 : 包括 9 个 单元 ,并且 其 中 每 个 单元 可 以 是 两 种 状态 中 的 一 个 , 因此 有 2 x2x2x2x 
2 x 2 x 2 x 2 x 2=512 种 不 同 的 可 能 。 
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。 EE 


目前 已 经 发 现 了 很 多 有 意义 的 模式 ， 包 括 用 不 同方 式 移动 的 网 格 形状 (spaceship) 、 产 生 一 
连 串 的 其 他 形状 (gun)， 或 者 其 至 产生 它们 自身 的 完整 复制 品 (replicator)。 


1982 年 ，Conway 除了 展示 如 何 靠 以 创造 性 的 方式 磁 撞 “请 翔 机 ”来 设计 逻辑 上 的 与 门 
(AND)、 或 门 (OR) 和 非 门 (NOT) 以 执行 数字 计算 之 外 ， 还 展示 了 如 何 使 用 一 连 串 的 
“请 翔 机 ”来 表示 二 进 制 数据 。 这 些 结构 说 明理 论 上 可 以 用 生命 游戏 模拟 一 个 数字 计算 机 ， 
但 Conway 没有 设计 出 来 一 台 可 工作 的 机 器 








到 这 里 ,构造 一 台 任意 的 大 型 有 限 (同时 非常 慢 ! ) 的 计算 机 只 是 一 个 工程 问题 了 
te ne de i Ee ] 我 们 已 双 了 模拟 
的 这 种 计算 机 从 学 术 上 被 称 为 通用 机 器 ， 因 为 它 可 以 编程 执行 任何 想 要 的 计算 





John Conway, 《 稳 操 胜 券 》 (Winning Ways for Your Mathematical Plays) 


2002 年 ，Paul Chapman 实现 了 一 个 特种 通用 计算 机 (http://www.igblan.free-online.co.uk/igblan/ 
ca/)。 而 2010 年 ，Paul Rendell 构造 出 了 一 台 通 用 图 灵机 (http://rendell-attic.org/gol/utm/)。 

















Eh Cs 
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7.8 rule 110 


rule 110 是 另 一 个 细胞 自动 机 ， 由 Stephen Wolfram 在 1983 年 提出 。 与 Conway 生命 游戏 
里 每 个 单元 要 么 是 生 的 要 么 是 死 的 类 似 ，rule 110 操作 的 单元 按 一 维 排列 而 不 是 二 维 网 格 
形式 。 这 意味 着 每 个 单元 只 有 两 个 邻居 而 不 是 围绕 着 每 个 生命 游戏 单元 的 8 个 邻居 。 


在 rule 110 自动 机 的 每 一 步 ， 一 个 单元 的 下 一 个 状态 是 由 它 自身 的 状态 和 它 两 个 邻居 的 状 
态 决 定 的。 与 生命 游戏 里 规则 都 是 通用 的 而 且 可 以 应 用 到 生 和 死 单元 不 同 ，rule 110 自动 
机 对 每 一 种 可 能 都 有 一 个 单独 的 规则 : 


HE EO 
{ 4 4 1 1 1 
OR 


tb ere era tr 把 一 个 死 单元 当成 0， 把 一 个 生 单 
人 4 、 元 当成 1， 就 可 以 得 到 二 进 制 数 01101110。 再 转换 可 以 产生 十 进 制 数 110， 
“~ 这 就 是 这 个 组 用 自动 机 名字 的 由 来。 































































































rule 110 比 生 命 游戏 简单 得 多 ， 但 它 同 样 有 复杂 行为 的 能 力 。 下 面 是 一 台 rule 110 自动 机 从 
一 个 简单 生 单元 开始 的 前 几 步 : 
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在 生成 一 行 固定 的 生 单元 ) ， 而 如 果 运 行 同 


们 就 可 以 看 到 有 趣 的 模式 : 
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7.9 Wolfram 的 2,3 图 灵机 


我 们 要 介绍 的 最 后 人 Wolfram 的 2.3 图 只 机 。 它 
的 名 字源 于 其 两 个 状态 和 三 个 字符 (a、b 和 空格 ) ， 这 意味 着 它 只 有 6 个 规则 : 














a/b;L 
b/a;l b/a;R 


才 





这 台 图 灵机 与 众 不 同 ， 因 为 它 没有 接受 状态 ， 因 此 它 从 来 不 会 停机 ， 但 这 主 

4 4 ， 要 是 一 个 技术 细节 。 我 们 仍然 可 以 通过 观察 特定 的 行为 来 得 到 不 停机 机 器 的 

疏 ， 结果 (例如 ， 纸 带 上 一 个 特定 模式 字符 的 出 现 )， 并 据 以 认为 当前 纸 带 含有 
有 用 的 输出 。 























Wolfram 的 2,3 图 灵机 看 起 来 没有 强大 到 能 支持 通用 计算 。2007 年 ，Wolfram Research 宣布 
将 给 予 能 证 明 它 是 通用 的 人 25 000 美元 的 奖励 。 那 年 下 半年 ，Alex Smith 通过 成 功 的 证 明 
拿 到 了 这 mB ule 0 一 样 ， 这 个 证 明 靠 的 是 展示 出 这 种 机 器 可 以 模拟 任何 循环 
标签 系统 。 这 个 证 明 还 是 非常 详细 的 ， 在 http://www.wolframscience.com/prizes/tm23/ 可 以 
看 到 全 文 。 
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不 可 能 的 程序 





世界 上 最 幸运 的 事 ， 是 人 脑 无 法 把 自身 的 内 容 全 部 关联 起 来 。 
一 一 霍华德 菲利普. 洛 夫 克拉 夫 特 





本 书 中 ， 我 们 已 经 探索 了 不 同 的 计算 机 和 编程 语言 模型 ， 其 中 包括 儿 种 抽象 机 器 。 这 些 机 
器 中 有 一 些 更 强大 ， 特 别 是 有 两 种 机 器 有 相当 明显 的 限制 有 限 自动 机 无 法 解决 涉及 无 限 
制 计数 的 问题 ， 例 如 判定 一 个 括号 组 成 的 字符 串 是 否 平衡 ， 下 推 自动 机 无 法 处 理 任 何 信 息 
需要 在 多 处 重用 的 问题 ， 例 如 判定 一 个 字符 串 是 否 含有 同样 数目 的 字符 a、b 和 c。 


但 我 们 已 经 看 到 的 最 先进 的 机 器 一 一 图 灵机 ， 似 乎 拥有 我 们 需要 的 一 切 : 拥有 无 限制 的 存 
储 ， 这 个 存储 能 以 任何 顺序 、 在 任意 的 循环 中 、 在 任意 的 条 件 语 句 以 及 子 例 程 中 访问 。 第 
6 章 中 的 极 小 编程 语言 lambda 演算 ， 被 证 明 也 出 奇 得 强大 : 稍 加 精心 设计 ， 它 就 允许 我 们 
把 简单 的 值 和 复杂 的 数据 结构 都 表示 成 纯 代 码 ， 还 能 实现 操纵 这 些 表示 的 运算 。 而 在 第 7 
章 ， 我 们 看 到 了 许多 简单 的 系统 ， 就 像 lambda 演算 一 样 ， 它 们 也 与 图 灵机 有 着 同样 的 通 
用 能 












































我 们 还 能 将 系统 不 断 增强 的 过 程 推进 多 少 ? 或 许 并 不 是 不 确定 的 : 我 们 通过 增加 特性 让 
灵机 做 更 强大 的 尝试 ， 但 没有 取得 任何 进展 ， 这 表明 计算 能 力 可 能 存在 着 一 种 硬性 的 限 
制 。 那 么 计算 机 和 编程 语言 的 基本 能 力 是 什么 呢 ? 有 什么 它们 做 不 到 的 事情 吗 ? 存在 不 可 
能 的 程序 吗 ? 


网 
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8.1 基本 事实 


这 都 是 相当 深奥 的 问题 ， 因 此 在 试图 理解 它们 之 前 ， 我 们 先 回顾 一 下 计算 领域 的 一 些 基 本 
事实 。 其 中 一 些 事实 很 明显 ， 而 有 一 些 没 那 么 明显 ,但 它们 都 是 思考 计算 机 的 能 力 和 限制 
的 前 提 条 件 。 


8.1.1 能 执行 算法 的 通用 系统 


通常 说 来 ， 使 用 像 图 灵机 、lambda 演算 和 部 分 递归 函数 这 样 的 通用 系统 我 们 能 干什么 呢 ? 
如 果 我 们 能 恰当 理解 这 些 系统 的 能 力 ， 那 就 可 以 考察 一 下 它们 的 限制 。 


计算 机 的 实际 目的 就 是 执行 算法 。 算 法 是 一 个 指令 列表 ， 指 令 描述 把 一 个 输入 值 转 成 一 个 
输出 值 的 过 程 ， 但 必须 满足 某 些 条 件 。 















































。 有 限 
指令 的 数量 是 有 限 的 。 

。 简单 
指令 要 足够 简单 ， 一 个 人 用 一 支 笔 和 一 张 纸 就 能 计算 出 结果 。 




















。 终止 


对 于 任何 输入 ， 一 个 遵守 指令 执行 的 人 都 会 在 有 限 步 骤 内 终止 。 








. 正确 
对 于 任何 输入 ， 一 个 遵守 指令 的 人 都 将 得 到 正确 的 答案 。 








例如 ， 一 个 已 知 最 古老 的 算法 是 欧 几 里 得 算法 ， 这 要 追溯 到 公元 前 300 年 。 它 以 两 个 正 整 
数 为 参数 ， 返 回 能 恰好 整除 它们 的 最 大 整数 一 一 也 就 是 它们 的 最 大 公约 数 。 下 面 是 它 的 


指令 。 


(1) 给 定 两 个 数 x 和 y。 

(2) 判断 x 和 yy 哪个 数 更 大 。 

(3) 从 大 的 数 中 减 去 小 的 数 。( 如 果 x 更 大 ， 就 从 x 中 减 去 y， 并 把 这 个 新 值 赋 给 xXx， 反之 
亦 然 。) 

(4) 重复 步骤 (2) 和 步骤 (3)， 直 到 x 和 y 相等 为 止 。 

(5) x 和 y 相等 的 时 候 ， 它 们 的 值 就 是 原来 两 个 值 的 最 大 公约 数 。 


我 们 很 愿意 承认 这 是 一 个 算法 ， 因 为 它 看 起 来 能 满足 基本 的 条 件 。 它 只 包含 有 限 的 几 条 指 
令 ， 而 且 都 足够 简单 ， 对 整个 问题 没有 特别 理解 的 人 也 可 以 使 用 铅笔 和 纸 算出 结果 。 再 稍 
微 思 考 一 下 ， 我 们 可 以 看 出 对 于 任意 的 输入 它 都 一 定 能 在 有 限 步 骤 内 结束 : 每 重复 一 次 步 
又 3， 两 个 数 中 的 一 个 就 会 变 小 一 些 ， 因 此 它们 最 终 一 定 会 到 达 同 样 的 值 并 让 算法 结束 。 
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这 个 算法 是 否 总 是 能 给 出 正确 的 答案 不 是 那么 明显 ， 但 一 些 代数 学 的 基础 就 足以 证 明 所 得 
到 的 结果 必定 是 原始 数字 的 最 大 公约 数 了 。 


所 以 欧 几 里 得 算法 确实 是 一 个 算法 。 但 像 任何 算法 一 样 ， 它 只 是 表示 为 人 类 可 读 语言 和 符 
号 的 思想 的 集合 。 如 果 想 要 用 它 做 一 些 有 用 的 事情 (或许 我 们 想 要 探索 它 的 数学 性 质 ， 或 
者 设计 一 台 自 动 执 行 它 的 机 器 )， 我 们 就 需要 把 算法 转换 成 一 个 更 严格 的 、 歧 义 更 少 的 形 
式 ， 这 才 适 合 数学 分 析 和 机 械 执 行 。 




















我 们 已 经 有 了 一 个 计算 模型 用 来 做 这 件 事情 : 可 以 尝试 把 欧 几 里 得 算法 写成 一 台 图 灵机 的 
规则 手册 ， 或 者 一 个 lambda 演算 的 表达 式 ， 或 者 一 个 部 分 递归 函数 定义 ， 但 所 有 这 些 都 涉 
及 内 部 的 处 理 以 及 其 他 一 些 枯燥 的 细节 。 我 们 暂时 先 把 它 转换 成 没有 限制 的 Ruby: ” 








def euclid(x, y) 
until x == y 
ifx>y 


Xx=x-y 


else 


了 sy 


end 


end 


X 
end 





本 质 上 这 个 #euclid 方法 与 欧 几 里 得 算法 的 自然 语言 描述 版 本 有 着 同样 的 指令 ， 但 这 次 它 
们 是 用 含义 严格 的 定义 方式 〈 根 据 Ruby 的 操作 语义 ) 写 的 ， 因 此 可 以 由 一 台 机 器 解释 : 





>> euclid(18, 12) 


=> 6 


>> euclid(867, 5309) 


=> 1 





在 这 个 特定 的 情况 下 ， 很 容易 把 一 个 非 形式 化 的 、 人 类 可 读 的 算法 描述 转换 成 对 一 台 机 器 


来 说 没有 歧义 的 指令 。 拥 有 机 器 可 读 形式 的 欧 几 里 得 算法 非常 方便 ， 现 在 我 们 无 需 手 工 劳 








动 就 可 以 快速 可 靠 地 反复 执行 这 个 算法 了 。 


六 





4 很 明显 我 们 还 可 以 用 与 6.1.7 节 类 似 的 技术 把 这 个 算法 用 lambda 演算 来 实 
CA 
te 

4 








、 现 ,或 者 从 7.2 节 的 操作 来 构建 一 个 部 分 递归 函数 ， 或 者 像 5.1.2 节 那 样 通过 
:简单 算术 运算 实现 一 个 图 灵机 的 规则 集合 。 











注 2: Ruby 


注 1: x 和 y 最 小 值 可 以 是 1。 


已 经 内 建 了 欧 几 里 得 算法 林 nteger#gcd， 但 这 不 是 重点 。 
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这 提出 了 一 个 重要 的 问题 : 任何 算法 都 能 转换 成 适合 一 台 机 器 执行 的 指令 吗 ? 表面 上 看 ， 
这 个 问题 似乎 不 值 一 提 一 一 如 何 把 欧 几 里 得 算法 转换 成 一 个 程序 相当 明显 。 而 作为 程序 
员 ， 我 们 有 天 然 的 倾向 会 把 两 者 看 成 可 互 换 的 一 一 但 在 一 个 计算 系统 中 ， 一 个 算法 抽象 
的 、 直 觉 的 思想 与 具体 的 、 逻 辑 上 的 实现 是 存在 实质 差别 的 。 是 否 存 在 一 个 算法 ， 它 大 、 
复杂 而 且 不 同 寻常 以 致 于 其 本 质 无 法 被 一 个 没有 思想 的 机 械 过 程 捕捉 呢 ? 




















最 终 可 能 没有 严谨 的 答案 ， 因 为 这 个 问题 是 哲学 层面 的 而 非 科 学 层面 的 。 一 个 算法 的 指令 
一 定 要 “简单 ”而 且 “ 不 精巧 "， 以 便 它 “ 能 由 一 个 人 计算 ”， 但 这 些 对 人 类 的 直觉 和 能 力 
来 说 都 是 不 严密 的 ， 这 并 不 是 能 用 来 证 实 或 者 推翻 一 个 假设 的 数学 化 断言 。 








不 管 怎样 ， 我 们 都 可 以 通过 提出 大 量 算法 并 观察 我 们 选择 的 计算 系统 〈 图 灵机 、lambda 演 
算 、 部 分 递归 国 数 ， 或 者 Ruby) 是 否 能 够 实现 它们 来 收集 证 据 。 数 学 家 和 计算 机 科学 家 
差不多 从 20 世纪 30 年 代 开始 就 已 经 在 这 么 做 了 ， 但 到 目前 为 止 还 没有 人 成 功 设计 出 这 些 
系统 不 能 执行 的 算法 。 因 此 我 们 可 以 对 经 验 上 的 直觉 相当 自信 : 一 台 机 器 肯定 能 执行 任何 
算法 。 

男 一 个 比较 强 的 证 据 是 这 些 系统 中 大 多 数 都 是 为 了 尝试 捕捉 和 分 析 一 个 算法 的 非 形 式 化 思 
想 而 独立 发 展 的 ， 只 是 后 来 才 被 发 现 彼此 之 间 恰 好 等 价 。 每 一 次 对 算法 思想 的 建 模 尝试 都 
产生 了 一 个 系统 ， 这 个 系统 的 能 力 与 一 台 图 灵机 的 能 力 等 价 ， 而 这 是 对 一 台 图 灵机 足够 表 
示 一 个 算法 的 很 好 暗示 。 

任何 算法 都 能 被 一 台 机 器 (特别 是 一 台 确 定型 的 图 灵机 ) 执行 的 思想 叫 作 鱼 奇 - 图 灵 论 题 
(Church-Turing thesis)。 尽 管 这 仅仅 是 一 个 猜想 而 不 是 一 个 被 证 明 的 事实 ， 但 有 足够 的 证 
据 让 它 成 为 广泛 接受 的 真理 。 

















幸 六 


“图 灵机 能 执行 任何 算法 ”是 个 哲学 层面 的 断言 ， 说 的 是 算法 的 直观 感觉 和 
A 
AN 

人 








。 用 来 实现 算法 的 形式 系统 之 间 的 关系 。 它 实际 的 含义 是 一 个 解释 的 问题 : 我 
， 们 可 以 把 它 看 成 关于 什么 能 计算 以 及 什么 不 能 计算 的 命题 ,或 者 作为 单词 
“算法 ”的 更 严格 的 一 个 定义 。 











不 管 怎样 ， 它 都 叫 “ 印 奇 一 图 灵 论 题 "*， 而 不 是 “ 邱 奇 一 图 灵 定 理 ”。 因 为 
它 是 一 个 非 形 式 化 的 断言 而 不 是 一 个 可 证 明 的 数学 断言 一 一 它 没 法 用 纯 数 学 
化 的 语言 表达 ， 因 此 没有 办 法 构建 数学 证 明 。 因 为 它 与 我 们 对 计算 本 质 的 直 
觉 判断 和 算法 能 做 事情 的 证 据 相符 ， 所 以 被 广泛 认为 是 真 的 ， 但 我 们 仍旧 称 
它 为 “论题 "， 以 便 提醒 自己 它 的 状态 与 毕 达 哥 拉 斯 定理 这 样 的 可 证 明 思 想 
不 同 。 


















































印 奇 一 图 灵 论 题 表 明 ， 图 灵机 尽管 简单 ， 但 拥有 执行 任何 计算 所 需要 的 所 有 能 力 ， 而 这 些 计 
算 原则 上 可 以 由 一 个 人 按照 简单 的 指令 执行 。 许 多 人 比 这 更 进一步 ， 他 们 认为 ， 既 然 所 有 对 
算法 编码 的 尝试 都 归结 到 了 与 图 灵机 能 力 等 价 的 通用 系统 上 ， 那 也 就 不 可 能 做 得 更 好 了 : 任 
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何 现实 世界 中 的 计算 机 或 者 编程 语言 只 能 做 到 与 图 灵机 做 的 一 样 多 的 事 ， 不 能 再 多 了 。 是 否 
最 终 有 可 能 构建 一 台 比 图 灵机 更 强大 的 机 器 一 一 能 使 用 外 来 的 物理 法 则 执行 超越 我 们 对 “ 算 
法 ”想象 的 任务 一 一 现在 还 不 能 确切 知道 ， 但 可 以 青 定 的 是 我 们 现在 不 知道 如 何 做 。 


8.1.2 能够 替代 图 灵机 的 程序 
就 像 我 们 在 第 5 章 中 看 到 的 那样 ， 图 灵机 的 简单 性 使 得 为 一 个 特定 任务 设计 一 个 规则 手册 


非常 困难 。 为 了 避免 对 可 计算 性 的 研究 被 图 灵机 编程 烦琐 的 细 市 干扰 ， 我 们 将 使 用 Ruby 
程序 作为 替身 ， 就 像 处 理 欧 几 里 得 算法 那样 。 









































这 个 方法 可 行 要 归 因 于 通用 性 : 原则 上 ， 我 们 可 以 把 任何 的 Ruby 程序 转换 成 一 个 等 价 的 
图 灵机 ， 反 之 亦 然 。 因 此 一 个 Ruby 程序 与 一 台 图 灵机 相 比 不 多 不 少 正好 能 力 相 当 ， 从 而 
我 们 发 现 的 关于 Ruby 能 力 的 任何 限制 都 应 该 可 以 同样 适用 于 图 灵机 。 




















一 个 明显 的 异议 是 Ruby 有 大 量 的 实用 函数 ， 而 图 灵机 没有 。Ruby 程序 可 以 访问 文件 系 
统 、 发 送 和 接收 网 络 上 的 消息 、 接 受用 户 输入 、 在 点 阵 式 显示 器 上 绘图 ， 等 等 ， 然 而 即使 
最 精致 的 图 灵机 规则 集合 也 只 能 在 一 条 纸 带 上 读 写 。 但 那 不 是 根本 的 问题 ， 因 为 所 有 这 些 
额外 的 函数 都 能 用 一 台 图 灵机 模拟 : 如 果 必 要 ， 我 们 可 以 把 纸 带 的 某 些 部 分 设计 成 用 来 表 
示 “ 文 件 系统 ”或 者 “网 络 ”或 者 “显示 器 ”或 者 任何 东西 ， 并 把 对 这 些 区 域 的 读 写 处 理 
得 就 像 与 外 边 的 真实 世界 交流 一 样 。 这 些 增强 没有 一 个 能 改变 图 灵机 的 潜在 计算 能 力 ， 它 
们 只 是 提供 了 对 纸 带 上 活动 的 高 层次 的 解释 。 


在 实践 中 ， 我 们 可 以 完全 把 自己 限制 在 简单 的 Ruby 程序 避免 使 用 任何 有 争议 的 语言 特性 ， 
以 此 来 规避 这 个 异议 。 本 章 的 其 余部 分 ， 我 们 写 程序 时 将 坚持 从 标准 输入 中 读 取 ， 进 行 一 
些 计算 ， 然 后 等 结束 的 时 候 把 字符 串 写 到 标准 输出 ;输入 字符 串 与 一 台 图 灵机 纸 带 的 初始 
内 容 类 似 ， 而 输出 字符 串 类 似 最 终 的 纸 带 内 容 。 


8.1.3 代码 即 数据 

程序 有 两 种 身份 。 除 了 把 程序 当 作 控 制 一 个 特定 系统 的 指令 之 外 ， 我 们 还 把 程序 看 成 是 纯 
数据 : 一 个 表达 式 树 ， 一 个 原始 字符 串 ， 或 者 甚至 一 个 大 的 数 。 这 种 双重 性 通常 会 被 程序 
员 认 为 理所当然 ， 但 程序 能 够 被 表示 成 数据 以 便 它们 能 用 做 提供 给 其 他 程序 的 输入 ， 对 通 
用 计算 机 来 说 是 至 关 重 要 的 。 正 是 代码 和 数据 的 统一 才 使 得 软件 成 为 可 能 。 


我 们 在 通用 图 灵机 的 讨论 中 已 经 看 到 了 作为 数据 的 程序 ， 它 期 望 另 一 台 图 灵机 的 规则 手册 
能 作为 字符 序列 写 到 它 的 纸 带 上 。 像 Lisp’ 和 XSLT 这 样 奇特 的 同体 异 构 编程 语言 〈 即 程 
序 与 数据 由 同样 的 结构 存储 ) ， 程 序 被 显 式 地 写成 语言 本 身 可 以 操纵 的 数据 结构 : 每 一 个 
Lisp 程序 是 一 个 称 为 s 表达 式 的 人 藤 套 列表 ， 而 每 一 个 XSLT 样式 表 是 一 个 XML 文档 。 





































































































注 3: Lisp 实际 上 是 一 个 编程 语言 的 家 族 ,包括 Common Lisp .Scheme 以 及 Clojure, 它们 有 着 非常 类 似 的 语法 。 
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在 Ruby 当中， 通常 只 有 解释 器 〈 至 少 在 MRI 中 不 是 用 Ruby 写 的 ) 才 会 关心 程序 的 结构 
化 表示 ， 但 把 代码 当 作 数 据 的 原则 仍然 适用 。 考 虑 下 面 这 个 简单 的 Ruby 程序 : 





puts 'hello wor]1d 





对 于 一 个 熟悉 Ruby 语法 和 语义 的 观察 者 来 说 ， 这 是 一 个 带 上 字符 串 hello world 把 一 个 


put 





s 消息 发 给 main 对 象 的 程序 ， 它 的 执行 结果 就 是 Kernel#puts 方法 把 hello world 进行 


标准 输出 。 但 在 更 低 的 层次 上 ， 它 只 是 一 个 字符 序列 ， 并 且 因 为 字符 是 表示 成 字 市 的 ， 所 
以 最 终 这 个 序列 可 以 看 成 是 一 个 很 大 的 数 : 


>> program = "puts “hello world'" 

=> "puts 'hello world'" 

>> bytes_in binary = program.bytes.map { |byte| byte.to s(2).rjust(8, '0') } 

=> ["01110000", "01110101", "01110100"，"01110011"， "00100000"， "00100111"， 
"01101000"， "01100101"，"01101100"， "01101100"， "01101111"， "00100000"”， 
"01110111", "01101111", "01110010"， "01101100"， "01100100"， "00100111" ] 

>> number = bytes_in binary.join.to i(2) 

=> 9796543849500706521102980495717740021834791 


从 某 种 意义 上 说 ，puts 'hello world' 是 Ruby 程序 数 979654384950070652110298049571 
7740021834791。” 反 过 来 说 , 如 果菜 个 人 告诉 我 们 一 个 Ruby 程序 的 数字 , 我 们 很 容易 把 它 
转换 回程 序 并 执行 它 : 











>> number = 9796543849500706521102980495717740021834791 

=> 9796543849500706521102980495717740021834791 

>> bytes_ in binary = number.to s(2).scan(/.+?(?=.{8}*\z)/) 

=> ["1110000", "01110101", "01110100"，"01110011"，"00100000"，"00100111"， 
"01101000","01100101"，"01101100"，"01101100"，"01101111"，"00100000"， 
"01110111", "01101111", "01110010", "01101100",，"01100100"，"00100111"] 

>> program = bytes_in binary.map { |string| string.to i(2).chr }.join 

=> "puts 'hello world'" 

>> eval program 

hello world 

=> nil 


当然 ， 把 程序 编码 成 大 数 是 为 了 把 它 存储 到 硬盘 上 ， 把 它 联接 互联 网 ， 以 及 把 它 提供 给 一 
个 Ruby 解释 器 (解释 器 本 身 在 硬盘 上 也 是 一 个 大 数字 ! )， 以 便 让 一 个 特定 的 计算 发 生 。 





寺 sa， 





既然 每 一 个 Ruby 程序 都 有 一 个 独一无二 的 数 ， 那 么 我 们 可 以 自动 生成 所 有 

















心 4 可 能 的 程序 : 从 数字 1 开始 生成 程序 ， 然 后 生成 程序 2， 以 此 类 推 。 如 果 用 
各 足够 长 的 时 间 做 下 去 的 话 ， 将 会 最 终 产生 下 一 个 热门 的 异步 Web 开发 框架 ， 
然后 我 们 就 可 以 退休 颐养 天 年 了 。 





注 4 
注 5 











: 只 把 数字 赋值 给 语法 有 效 的 Ruby 程序 会 更 有 用 ， 但 那么 做 会 更 复杂 。 
: 那些 数字 中 的 大 多 数 都 不 表示 语法 有 效 的 Ruby 程序 ， 但 我 们 可 以 把 每 个 潜在 的 程序 提供 给 Ruby 解 
析 器 ， 如 果 有 任何 的 语法 错误 的 话 , 就 丢弃 掉 它 。 
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和 8 重 


8.1.4 可 以 永远 循环 的 通用 系统 

我 们 已 经 看 到 通用 目的 的 计算 机 是 通用 的 : 可 以 设计 一 台 能 模拟 其 他 任何 图 灵机 的 图 灵 
机 ， 或 者 写 一 个 能 对 其 他 任何 程序 求 值 的 程序 。 通 用 性 是 个 强大 的 思想 ， 这 样 不 同 的 任务 
只 用 一 台 可 改写 的 机 器 而 不 是 很 多 专门 机 器 就 可 以 完成 。 但 它 也 有 不 方便 的 地 方 : 任何 强 
大 到 足以 通用 的 系统 ， 都 不 可 避免 地 人 允许 我 们 构建 永 不 停机 一 直 循 环 的 计算 。 


























超 长 时 间 运 行 的 计算 
“我 想 要 说 的 是 ,” 计 算 机 史 哮 着 ,“ 我 的 电路 现在 已 经 无 法 撤销 地 开始 计算 生 
命 、 宇 宙 \ 和 一 切 终 极 问题 的 答案 。” 它 组 了 一 下 ， 对 现在 能 引起 所 有 人 的 注意 
感到 很 满意 ， 于 是 降低 了 音量 :“ 但 程序 运行 要 稍微 花费 我 一 点 儿 时 间 。” 


福 克 不 耐烦 地 萤 了 一 限 他 的 手表 。 
“要 多 久 ? ”他 问 。 
“750 万 年 。 深思 回答 说 。 


一 一 道格拉斯 * 亚当 斯 , 《银河 系 漫 游 指 南 》 
(The Hitchhiker s Guide to the Galaxy) 


如 果 我 们 试图 执行 一 个 算法 一 一 目的 是 把 输入 转 成 输出 的 指令 列表 一 一 那么 永远 循环 
就 是 一 件 坏事 了 。 我 们 想 要 一 台 机 器 (或 者 程序 ) 在 有 限时 间 内 运行 然后 停机 并 给 出 
菜 些 输出 ， 而 不 只 是 安静 地 在 那儿 变 热 。 所 有 其 他 孝 相 等 的 情况 下 ， 最 好 能 有 计算 机 
和 语言 ， 篆 们 的 每 个 任务 都 保证 在 有 限 步骤 内 结束 ， 这 样 我 们 就 不 必 关 心 最 终 是 否 会 
有 答案 了 。 


但 是 在 一 些 实际 的 应 用 中 ， 永 远 循环 是 设计 好 的 。 例 如 ， 一 个 像 Apache 或 者 Ngnix 这 
样 的 Web 服务 器 如 果 只 能 接受 一 个 HTTP 请 求 ， 发 送 响应 然后 就 退出 的 话 ， 是 没什么 

用 的 ; 我 们 想 要 它 无 限期 运行 下 去 ， 在 强制 停止 前 继续 为 每 个 到 来 的 请 求 服务 。 但 从 
概念 上 讲 ， 我 们 可 以 把 一 个 单线 程 的 Web 服务 器 分 成 两 部 分 : 一 是 处 理 单个 请 求 的 代 
码 ， 它 应 该 总 是 能 停机 ， 以 便 能 6 发 送 响 应 ， 二 是 它 的 外 边 应 该 有 一 个 无 限 循环 ， 能 隧 
着 每 个 新 请 求 的 到 来 不 断 调用 请 求 处 理 器 。 在 这 种 情况 下 ， 即 使 封装 器 需要 永远 运行 ， 
在 复杂 的 请 求 处 理 代 码 里 无 限 循环 仍然 是 一 件 坏事 。 

真实 世界 提供 了 很 多 程序 的 实例 ， 它 们 在 一 个 无 限 循 环 中 反复 执行 停机 计算 : Web 服 
务 器 、GUI 应 用 、 操 作 系 统 ， 等 等 。 尽 管 我 们 通常 想 要 算法 的 输入 输出 程序 总 能 停机 ， 
但 这 些 长 时 间 运 行 的 系统 的 类 似 目 标 是 高 效 ， 也 就 是 说 总 是 “保持 运行 ”并 且 永 远 都 
不 要 陷入 无 响应 的 状态 。 
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那么 为 什么 每 个 通用 系统 都 把 非 终结 作为 属性 呢 ? 有 没有 什么 天 才 的 方法 能 限制 图 灵机 以 
便 它 们 总 是 能 停机 ， 而 不 必 在 它们 的 用 处 上 做 出 妥协 呢 ? 怎么 知道 我 们 某 一 天 不 会 设计 出 
一 种 编程 语言 ， 它 与 Ruby 一 样 强 大 但 不 包含 无 限 循 环 呢 ? 对 于 为 什么 它们 无 法 做 到 有 各 
种 具体 的 例子 ， 但 还 有 一 个 更 通用 的 论据 ， 让 我 们 演练 一 下 。 





Ruby 是 一 种 通用 编程 语言 ， 因 此 写 一 个 能 对 Ruby 代码 求 值 的 Ruby 代码 一 定 是 可 能 的 。 
原则 上 讲 ， 我 们 可 以 定义 一 个 叫 #evaluate 的 方法 ， 它 的 参数 是 一 个 Ruby 程序 的 代码 和 
一 个 标准 输入 提供 给 程序 的 字符 串 ， 然 后 对 那个 程序 求 值得 到 结果 (也 就 是 说 ， 字 符 串 会 
发 给 标准 输出 )。 





在 本 章 中 包含 进 #evaluate 的 实现 过 于 复杂 了 ， 但 下 面 是 对 它 最 可 能 工作 方式 的 概括 : 


def evaluate(program, input) 
# 解析 程序 
# 在 捕获 输出 的 同时 基于 输入 对 程序 求 值 
# 返回 输出 

end 











方法 #evaluate 本 质 上 是 一 个 Ruby 写 的 Ruby 解释 器 。 尽 管 我 们 还 没有 对 其 实现 ,但 写 出 
它 来 是 可 能 的 : 首先 把 程序 转 成 一 个 符号 序列 ， 然 后 分 析 它 们 构建 一 个 解析 树 (参见 4.3 
节 )， 再 根据 Ruby 的 操作 语义 (参见 2.3 节 ) 对 这 个 分 析 树 求 值 。 这 是 一 个 大 而 复杂 的 工 
作 ， 但 它 肯 定 能 完成 ， 不 然 的 话 ，Ruby 就 不 能 满足 通用 性 了 。 

为 了 简单 ， 假 设 我 们 对 #evaluate 的 假想 实现 是 无 bug 的 ， 在 它 对 程序 求 值 的 时 候 不 会 月 
溃 。 当 然 它 可 能 会 返回 某 个 结果 ， 这 个 结果 表明 这 个 程序 在 求 值 的 过 程 中 会 引发 异常 ， 但 
那 与 #evaluate 本 身 实际 执行 中 的 崩溃 是 不 一 样 的 。 
































= Ruby 恰好 有 一 个 内 建 的 Kernel#eval 方法 能 对 Ruby 代码 的 字符 串 求 值 ， 但 

《4 ， 这 里 利用 这 个 方法 有 点 自 欺 其 人， 特别 是 因为 (在 MRI 中) 它 是 用 C 语言 

全 ”实现 的 ， 而 不 是 Ruby。 它 对 当前 的 讨论 也 没有 必要 ， 我 们 把 Ruby 当 作 任 意 
通用 编程 语言 的 典型 实例 ， 但 许多 通用 性 语言 没有 内 建 的 eval。 









































但 是 请 注意 ， 既 然 它 摆 在 那儿 ， 为 了 让 #evaluate 减少 一 点 想象 的 成 分 ， 我 
们 不 去 用 它 就 太 不 好 意思 了 。 下 面 是 一 次 粗略 的 尝试 ， 请 多 包涵 : 


require “Stringio 





def evaluate(program, input) 
old stdin, old stdout = $stdin, $stdout 
$stdin, $stdout = StringIO0.new(input), (output = StringI0.new) 


begin 
eval program 
rescue Exception => e 
output.puts(e) 
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ensure 
$stdin, $stdout = old stdin, old stdout 
end 
output. string 
end 


这 个 实现 A ni 它们 都 能 通过 写 纯 Ruby 的 #evaluate 
来 避免 。 另 一 方面 ， 从 演示 角度 看 ， 这 个 实现 足够 简短 而 且 工 作 得 足够 好 : 


>> evaluate('print $stdin.read.reverse', 'hello world') 
=> "dlrow olleh" 

















方法 #evaluate 的 存在 允许 我 们 定义 另 一 个 方法 : #evaluate_on_itself， 它 返回 用 它 自 己 
的 源 代码 作为 输入 对 程序 求 值 的 结果 : 





def evaluate on itself(program) 
evaluate(program, program) 
end 








这 可 能 有 点 苑 唐 ， 但 是 完全 合法 ; 程序 只 是 一 个 字符 串 ， 因 此 我 们 完全 可 以 把 它 既 当 成 一 
个 Ruby 程序 又 当成 对 这 个 程序 的 输入 。 代 码 即 数据 ， 对 吧 ? 











>> evaluate on itself('print $stdin.read.reverse') 
=> "esrever.daer.nidts$ tnirp" 


既然 我 们 知道 可 以 用 Ruby 实现 #evaluate 和 #evaluate_on_itself， 因 而 就 能 写 出 完整 的 
Ruby 程序 does_it_say_no.rb: 





def evaluate(program, input) 
# 解析 程序 
# 在 捕获 输出 的 同时 基于 输入 对 程序 求 值 
# 返回 输出 
end 














def evaluate on itself(program) 
evaluate(program, program) 
end 


program = $stdin.read 


if evaluate on itself(program) == “no 
print 'yes' 

else 
print 'no' 

end 


个 程序 是 对 现 有 代码 的 一 个 直接 应 用 : 它 定 义 了 #evaluate 和 #evaluate on itself， 然 
> 个 Ruby 程序 ， 最 后 把 它 传 给 #evaluate_on_itself。 来 看 看 它 以 
自身 作为 输入 的 时 候 程 序 能 干什么 。 如 果 输 出 的 结果 是 字符 串 “no ，does_it_say_no.rb 会 
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输出 "yes ， 否 则 它 会 输出 'no' 。 例 如 :“ 


$ echo 'print $stdin.read.reverse' | ruby does it say no.rb 
no 





这 是 期 望 的 结果 ， 就 像 我 们 上 面 看 到 的 ， 在 用 其 自身 运行 print$stdin.read.reverse 
时 ， 会 得 到 输出 esrever.daer.nidts$tnirp， 它 与 no 不 相等 。 得 到 输入 no 的 程序 会 怎么 
样 呢 ? 





$ echo “if $stdin.read.include?("no") then print "no" end' | ruby does it say no.rb 
yes 


这 次 仍然 与 期 望 一 致 。 


那么 下 面 是 大 问题 了 : 在 运行 ruby does_it_say_no.rb < does it _say_no.rb 时 ， 会 发 生 什么 
呢 ? “在 脑子 中 要 记 住 does_it_say_no.rb 是 一 个 真实 的 程序 一 一 用 足够 的 时 间 和 热情 可 以 
完整 写 出 来 的 一 个 程序 一 一 因此 ， 它 一 定 有 结果 ， 只 是 没 那 么 显而易见 。 让 我 们 试 着 通过 
考虑 所 有 的 可 能 然后 去 掉 讲 不 通 的 来 把 它 实 现 出 来 。 

首先 ， 以 自身 代码 作为 输入 来 运行 这 个 特定 程序 不 能 产生 输入 yes。 根 据 程序 自己 的 逻辑 ， 


输出 yes 只 能 在 对 自身 代码 运行 does_it_say_no.rb 输出 no 时 才 会 发 生 ， 这 与 原来 的 承诺 是 
冲突 的 。 因 此 这 样 不 行 。 


好 吧 ， 那 么 可 以 改 为 输出 no。 但 程序 的 结构 意味 着 ， 只 有 同样 的 计算 没有 输出 no 它 才能 
输出 no 一 一 又 冲突 了 。 


有 可 能 输出 一 些 其 他 字符 串 ， 比 如 maybe， 甚 至 空 字符 串 吗 ? 那 可 能 还 是 会 冲突 : 如 果 
evaluate_on itself(program,program) 没有 返回 no 那 程序 还 是 会 输出 no。 















































因此 它 不 能 输出 yes 或 者 no， 不 能 输出 别 的 什么 ， 并 且 除 非 方 法 #evaluate 含有 bug， 不 
然 它 不 可 能 月 涡 ， 但 这 个 已 经 假定 不 会 了 。 唯 一 的 可 能 性 是 它 不 产生 任何 输出 ， 而 这 只 会 
在 程序 永 不 停止 的 时 候 才 会 发 生 : #evaluate 一 定 要 永远 循环 ， 不 返回 结果 。 























实际 上 几乎 可 以 确定 ruby does_it_say_no.rb < does_it_say_no.rb 将 会 耗 尽 主 
机 的 有 限 内 存 ， 引 起 ruby 崩 涡 ， 而 不 会 真 的 永远 循环 下 去 。 但 这 是 外 部 施加 
”给 程序 的 资源 限制 ， 而 不 是 程序 本 身 的 属性 ， 理论 上 讲 ， 只 要 有 需要 我 们 可 
以 持续 给 计算 机 增加 更 多 的 内 存 让 计算 机 无 限 运 行 下 去 。 




















注 6: 我 们 这 里 使 用 的 是 Unix shell 语法 。 在 Windows 平台 上 ， 要 忽略 echo 参数 周围 的 单 引 号 ， 或 者 把 文 
本 放 到 文件 里 ， 并 把 它 用 < 输入 重 定向 符 提供 给 ruby。 
注 7: 这 是 一 个 shell 命令 ， 以 它 自 身 源 代码 作为 输入 运行 does_it_say_no.rb。 





















































A 
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用 这 么 复杂 的 方式 说 明 Ruby 允许 我 们 写 不 停机 程序 看 起 来 是 没有 必要 的 。 毕 况 while 
true do end 能 让 我 们 做 相同 的 事 ， 但 它 简 单 得 多 。 


但 通过 思考 does it_say_no.rb 的 行为 ， 我 们 已 经 展示 了 不 管 系统 有 什么 特性 ， 不 停机 程序 
是 通用 性 的 一 个 不 可 避免 的 结果 。 我 们 的 观点 除了 依赖 Ruby 的 通用 性 之 外 不 依赖 Ruby 
的 任何 特殊 能 力 ， 因 此 同样 的 思想 也 可 以 适用 于 图 灵机 ， 或 者 lambda 演算 ， 或 者 任何 其 
他 的 通用 系统 。 只 要 在 使 用 一 种 强大 到 能 对 自身 求 值 的 语言 ， 我 们 就 知道 一 定 可 能 使 用 
#evaluate 的 等 价 物 构建 永 不 停机 的 程序 ， 而 不 需要 知道 关于 语言 能 力 的 任何 其 他 东西 。 












































特别 地 ， 在 编程 语言 中 移 除 特性 (如 while 循环 ) 并 不 能 阻止 我 们 在 保持 语言 足以 通用 的 
同时 还 能 写 出 不 停机 的 程序 来 。 如 果 移 除了 一 个 特性 让 一 个 程序 无 法 永远 循环 ， 一 定 也 不 
可 能 实现 #evaluate 了 。 








被 仔细 地 设计 以 保证 它们 的 程序 一 定 总 是 能 停机 的 语言 叫 作 完 全 编程 语言 。 与 之 相对 的 是 
更 常见 的 部 分 编程 语言 ， 这 样 语言 的 程序 有 时 候 能 停机 给 出 答案 ， 有 时 候 不 能 。 完 全 编程 
语言 仍然 非常 强大 ， 能 表达 许多 有 用 的 计算 ， 但 它们 不 能 做 到 的 就 是 解释 自身 。 








这 很 奇怪 ， 虽然 对 一 种 完全 编程 语言 ， 从 定义 上 来 说 #evaluate 的 等 价 物 一 
‘4 定 总 是 能 停机 的 ， 但 用 那 种 语言 是 无 法 实现 的 一 一 如 果 它 可 以 实现 的 话 ， 我 
中， 们 就 能 使 用 does_it_say_no.rb 技术 让 它 永 远 循环 了 。 





这 让 我 们 对 一 个 不 可 能 的 程序 有 了 初步 了 解 : 无 法 用 完全 编程 语言 写 一 个 对 
其 自身 的 解释 器 ， 即 使 为 了 解释 它 存在 一 个 令 人 尊敬 的 保证 能 停机 的 算法 也 
不 行 。 事 实 上 ， 它 是 如 此 令 人 尊敬 以 至 于 我 们 能 用 另 一 种 更 复杂 的 完全 编程 
语言 写 出 来 ， 但 这 个 新 的 完全 编程 语言 也 不 能 实现 它 自己 的 解释 器 。 



























































虽然 是 个 有 意思 的 东西 ， 但 完全 编程 语言 的 设计 有 人 为 的 限制 ， 我 们 一 直 在 
寻找 所 有 计算 机 或 者 编程 语言 不 能 完成 的 东西 。 我 们 最 好 继续 努力 。 


8.1.5 能 引用 自身 的 程序 


does_it_say_no.rb 使 用 的 自 引 用 的 小 技巧 构建 出 一 个 能 读 自己 源 代码 的 程序 ， 但 或 许 假定 
总 是 会 有 点 自 其 其 和 信 。 在 我 们 的 例子 里 ， 程 序 收 到 了 自己 的 源 代码 作为 一 个 明确 的 输入 ， 
这 要 感谢 环境 (如 shell) 提供 的 功能 ， 要 没有 这 个 选择 的 话 ， 它 可 能 也 会 利用 Ruby 的 文 
件 系 统 API 和 总 是 包含 当前 文件 名 的 _FILE_ 常量 ， 直 接 用 File.read(_FILE_) 从 硬盘 
读 取 数 据 。 











但 我 们 应 该 提出 一 个 通用 的 论点 ， 只 依赖 Ruby 的 通用 性 ， 而 不 是 依赖 操作 系统 或 者 File 
类 的 能 力 。 像 Java 和 C 这 样 运行 时 没有 权限 访问 自身 产 代 码 的 编译 语言 呢 ? 像 JavaScript 
这 样 通过 网 络 连接 被 加 载 到 内 存 而 且 可 能 根本 不 会 存储 到 本 地 文件 系统 的 程序 呢 ? 像 图 灵 
机 和 lambda 演算 这 样 自 包含 的 通用 系统 ， 它 们 根本 没有 “文件 系统 ”和 “标准 输入 ”的 
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概念 ， 又 会 怎样 呢 ? 


幸运 的 是 ，does_it_say_no.rb 参数 能 经 受 住 这 些 异 议 ， 因 为 让 一 个 程序 从 标准 输入 读 取 它 自 
己 的 源 代码 只 不 过 是 一 个 对 所 有 通用 系统 都 能 完成 的 某 个 事情 的 为 简化 ， 而 且 与 它们 的 环 
境 和 其 他 特性 无 关 。 这 是 一 个 叫 作 Kleene 第 二 递归 定理 的 推论 (Kleene’s second recursion 
theorem) ， 它 保证 了 任何 程序 都 可 以 转换 成 能 计算 自身 源 代 码 的 等 价 物 。 递 归 理论 提供 了 
我 们 所 做 简化 的 合理 保证 : 本 可 以 把 program = $stdin.read 用 一 些 代码 替换 ， 以 便 生 成 
does_it_say_no.rb 的 源 代 码 并 把 它 赋 给 程序 而 不 必 进 行 任何 IO。 

















来 看 看 如 何在 一 个 简单 的 Ruby 程序 上 做 这 种 转换 。 例 如 : 


我 们 想 要 把 它 转 换 成 类 似 这 样 的 程序 


program =“...' 
X = 工 

y=2 

puts x+y 


a 这 里 程序 被 赋予 了 一 个 含有 完整 程序 源 代码 的 字符 串 。 但 程序 的 值 应 该 是 多 少 呢 ? 








一 个 天 真 的 做 法 是 尝试 编造 一 个 能 赋值 给 程序 的 简单 字符 串 ， 但 这 很 快 就 会 让 我 们 陷入 麻 
烦 ， 因 为 这 个 字符 串 将 是 程序 源 代码 的 一 0 这 会 i 
序 以 字符 串 'program =' 开头 ， 后 边 是 程序 的 值 ， 这 个 值 还 会 是 字符 串 'program = ， 后 边 
再 跟着 程序 的 值 ， 这 样 一 直 类 推 下 去 : 

program = %q{program = %q{program = %q{program = %q{program = %q{program = %q{...}}}}}} 


Xx=1 
y=2 
puts x+y 

















硅 全 


Ruby 的 %q 语法 允许 我 们 使 用 一 对 定 界 符 来 引用 不 可 修改 的 字符 串 ， 在 这 个 
CA 
MA 














。 场 景 下 是 花 括 号 ， 而 不 是 一 对 引号 。 优 点 是 只 要 定 界 符 能 正确 匹配 ， 这 个 字 
会， 符 串 就 可 以 包含 定 界 符 的 非 转 义 实例 ; 


>> puts %q{Curly brackets look like { and }.} 

Curly brackets look like { and }. 

=> nil 

>> puts %q{An unbalanced curly bracket like } is a problem.} 
SyntaxError: syntax error, unexpected tIDENTIFIER, expecting end-of-input 








使 用 %q 而 不 是 单 引 号 可 以 帮助 我 们 避免 令 人 头疼 的 包含 自身 定 界 符 的 字符 
中 里 的 字符 转 义 ， 


program = "program = \'program = \\\'program = \\\\\\\\...\\\\\\A\\\\\ 











从 这 个 “ 坑 ” 里 爬 出 来 的 方法 是 利用 一 个 事实 ， 那 就 是 一 个 程序 中 用 到 的 值 没有 必要 出 现 
在 它 的 源 代码 里 ， 还 可 以 从 其 他 数据 动态 计算 出 来 。 这 意味 着 我 们 可 以 把 转换 的 程序 构建 
成 三 部 分 : 


A. 把 一 个 字符 串 赋 值 给 一 个 变量 (如 data) ; 
B. 使 用 字符 串 计算 当 前 程序 的 源 代码 并 将 其 赋值 给 pragram; 
C. 做 程序 应 该 做 的 所 有 其 他 工作 (原来 代码 的 工作 )。 


因此 ， 程 序 的 结构 将 会 变 成 这 样 : 


























data = "..." 
program = ... 
X=1 
y=2 

puts x+y 

















这 作为 一 个 一 般 策 略 听 起 来 貌似 有 理 ， 但 在 具体 的 细节 上 还 有 些 问题 。 我 们 怎么 知道 A 部 
分 中 要 赋值 给 data 什么 字符 串 ， 并 且 我 们 怎么 用 其 在 B 部 分 中 对 pragram 进行 计算 呢 ? 下 
面 是 一 个 解决 方案 。 


。 在 A 部 分 中 ， 创 建 一 个 包含 B 和 C 部 分 的 字符 串 ， 并 把 这 个 字符 串 赋 值 给 data。 这 个 
字符 串 不 应 该 “包含 自身 "， 因 为 它 不 是 整个 程序 的 源 代 码 ， 只 包含 A 部 分 之 后 的 部 分 
程序 。 

。 在 B 部 分 中 ,首先 计算 一 个 含有 A 部 分 源 代 码 的 字符 串 。 因 为 A 部 分 通常 含有 一 个 值 
可 用 作 data 的 大 的 字符 串 ， 所 以 我 们 可 以 这 么 做 。 因 此 只 需要 用 'data =' 给 data 的 值 
加 上 前 级 ， 以 此 来 重建 A 部 分 的 源 代码 。 然 后 只 是 把 这 个 结 末 与 data 连接 起 来 得 到 整 
个 程序 的 源 代码 (因为 data 含有 B 部 分 和 C 部 分 的 源 代码 了 ) 并 将 其 赋值 给 程序 。 

这 个 设计 仍然 有 些 不 够 直接 (A 部 分 产生 B 部 分 的 源 代码 ， 而 B 部 分 产生 A 部 分 的 源 代 

码 )， 但 它 通过 保证 B 部 分 只 计算 A 部 分 的 源 代码 而 不 必 把 它 包 含 进来 ， 这 刚好 避免 了 无 

限 的 倒退 。 


















































先 把 已 知 的 做 出 来 吧 。 我 们 已 经 有 了 B 和 C 部 分 的 大 部 分 源 代码 ， 因 此 可 以 部 分 地 完成 数 
据 的 值 了 : 


data = %q{ 
program = ... 
x=1 
y=2 

puts x+y 


program = ... 
X = 工 
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我 们 还 知道 A 部 分 的 源 代码 只 是 字符 串 “data 





4 
te 
、 


data 需要 换行 符 。 通 过 在 一 个 不 可 修改 的 字符 串 里 把 这 些 表示 为 现行 的 换 
。 行 符 ， 而 不 是 表示 成 可 修改 的 m 转 义 序列 ， 我 们 就 能 把 B 和 C 部 分 的 源 代 


会， 码 逐 字 的 包括 进来 ， 而 不 必 进 行 任何 特殊 的 编码 的 转 义 。* 这 样 直 接 的 复制 
粘贴 让 A 部 分 的 源 代 码 更 容易 计算 。 


%q{.…} ， 再 加 上 花 括号 中 间 填 充 好 的 


data 的 值 ， 因 此 还 可 以 部 分 地 完成 pragram 的 值 : 


data = %q{ 

program = ... 

xXx=1 

y=2 

puts x+y 

} 

program = "data = %q{#{data}}" + ... 
X=1 

y = 2 

puts x+y 


现在 所 有 pragram 中 缺失 的 就 是 B 和 C 部 分 的 源 代码 了 ， 这 恰好 就 是 data 包含 的 内 容 ， 
因此 我 们 可 以 把 data 的 值 添 加 到 程序 来 完成 任务 : 


3 


后 


data = %q{ 
program = ... 
X=1 
y=2 

puts x+y 

} 


program = "data = %q{#{data}}" + data 


x=1 
y=2 
puts x+y 





回头 改进 一 下 data 的 值 以 反映 B 


E 


data = %q{ 


部 分 : 


program = "data = %q{#{data}}" + data 


Xx=1 
y=2 
puts x+y 
} 


program = "data = %q{#{data}}" + data 


x=1 
y=2 
puts x+y 





注 8: 





因 
包含 的 话 ， 我 们 就 得 想 办 法 对 它们 转 义 然 














为 B 和 C 部 分 恰好 不 包含 任何 如 反 斜 杠 或 者 不 平衡 花 括 号 的 字符 ， 我 们 才能 





后 作为 


绕 行 


绕 行 成 功 。 如 果 它 们 
[ 编 pragram 值 的 一 部 分 撤销 掉 转 义 。 
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第 8 章 


就 是 它 了 ! 这 个 程序 和 原来 的 作用 一 样 ， 但 现在 它 有 了 额外 的 含有 自身 代码 的 本 地 变 
可 它 实际 上 没 用 那个 变量 做 任何 事情 。 如 果 转 换 一 个 程序 ， 它 需要 一 个 程序 的 本 地 变量 
然后 用 它 做 点 什么 ， 那 会 怎么 样 呢 ? 看 下 面 这 个 经 典 的 例子 : 


可 


Ef 地 








并 














puts program 








这 是 一 个 尝试 输出 它 自己 源 代 码 的 程序 ,“ 但 它 明 显 会 失败 。 因 为 program 是 一 个 未 定义 的 
变量 。 如 果 我 们 通过 自 引 用 的 变换 来 运行 它 ， 可 以 得 到 如 下 结果 : 


-~ 


data = %q{ 

program = "data = %q{#{data}}" + data 
puts program 

} 

program = "data = %q{#{data}}" + data 
puts program 


有 点 意思 了 。 让 我 们 在 控制 台 上 看 看 这 个 代码 能 干什么 : 


>> data = %q{ 
program = "data = %q{#{data}}" + data 
puts program 


=> "\nprogram = \"data = %q{\#{data}}\" + data\nputs program\n" 
>> program = "data = %q{#{data}}" + data 

=> "data = %q{\nprogram = \"data = %q{\#{data}}\" + data\nputs program\n}\n 
program = \"data = %q{\#{data}}\" + data\nputs program\n" 

>> puts program 

data = %q{ 

program = "data = %q{#{data}}" + data 

puts program 

} 

program = "data = %q{#{data}}" + data 

puts program 

=> nil 


可 以 确定 了 ，puts program 实际 上 输出 了 整个 程序 的 源 代码 。 


很 明显 这 个 变换 不 依赖 程序 本 身 的 任何 特别 的 属性 ， 因 此 对 任何 Ruby 程序 它 都 能 工作 ， 
而 且 不 必 使 用 $stdin.read 或 者 File.read(_FILE_) 读 取 程序 自身 的 源 代码 。" 它 也 不 依 
赖 Ruby 本 身 的 任何 特别 属性 一 一 只 需要 像 任何 其 他 通用 系统 一 样 根据 旧 值 计算 新 值 的 能 
力 一 一 这 意味 着 任何 图 灵机 都 能 引用 它 自己 的 编码 ， 任 何 lambda 演算 表达 式 都 能 扩展 成 
含有 表示 它 自 身 语法 的 lambda 演算 表达 式 ， 以 此 类 推 。 


























注 9; 侯 世 达 (Douglas Hofstadter) 为 输出 自己 的 程序 杜撰 了 名 字 奎 因 (quine)。 
注 10: 是 不 是 忍 不 住 要 写 一 个 能 对 任意 Ruby 程序 执行 这 个 转换 的 Ruby 程序 了 ? 如 果 使 用 %qf[] 来 引用 数 
据 的 值 ， 那 你 如 何 处 理 原 始 代码 中 的 反 斜 枉 和 不 平衡 的 大 括号 呢 ? 
































不 可 能 的 程序 | 249 





8.2 可 判定 性 

到 目前 为 止 我 们 已 经 看 到 图 灵机 有 非常 多 的 能 力 和 灵活 性 ， 它们 可 以 执行 编码 成 数据 的 任 
意 程序 ， 执 行 我 们 能 想 出 来 的 任意 算法 ， 运 行 无 限 长 时 间 ， 对 它们 自身 的 描述 进行 计算 。 
尽管 它们 很 简单 ， 可 这 些小 的 假想 的 机 器 都 已 经 被 证 明 能 表示 一 般 的 通用 系统 。 











如 果 它 们 这 么 强大 而 灵活 ， 那 是 否 存 在 图 灵机 乃至 真实 世界 的 计算 机 和 编程 语言 不 能 做 的 
事情 呢 ? 








在 回答 这 个 问题 之 前 ， 需 要 让 这 个 问题 更 明确 一 些 。 我 们 可 以 让 一 台 图 灵机 做 什么 样 的 事 
情 呢 ? 怎么 识别 它 已 经 干 完了 呢 ? 需要 研究 每 一 种 可 能 的 问题 吗 ?或 者 只 考虑 其 中 一 部 分 
问题 是 否 足够 呢 ? 我 们 只 是 在 寻找 解法 超越 自己 当前 理解 的 问题 ， 还 是 在 寻找 已 经 知道 永 
远 不 能 解决 的 问题 呢 ? 





























我 们 可 以 通过 集中 在 判定 性 问题 上 以 缩小 问题 范围 。 判 定性 问题 的 答案 为 是 或 者 否 ， 就 像 
“2 比 3 小 吗 ? ”或 者 “正则 表达 式 (a(1b))* 与 字符 串 'abaab" 匹配 吗 ? ”功能 性 问题 的 答 
案 是 一 个 数 或 者 某 个 非 布尔 值 ， 如 “18 和 12 的 最 大 公约 数 是 多 少 ? ”判定 性 问题 比 处 理 
功能 性 问题 要 容易 一 些 ， 但 它们 仍然 很 有 趣 ， 值 得 我 们 研究 。 


如 果 存 在 一 个 算法 ， 对 任何 可 能 的 输入 都 能 保证 在 有 限时 间 内 解决 一 个 判定 性 问题 ， 那 么 
这 个 问题 就 是 可 判定 的 (或 者 叫 可 计算 的 )。 印 奇 一 图 灵 论 题 认 为 每 一 个 算法 都 能 由 图 灵 
机 执行 ， 所 以 对 于 一 个 可 判定 性 的 问题 ， 我 们 需要 设计 一 台 总 是 产生 正确 答案 的 图 灵机 ， 
并 且 如 果 运 行 足够 长 的 时 间 ， 它 总 是 能 停机 。 把 一 台 图 灵机 的 最 终 配 置 解释 成 “是 ”或 者 
“ 否 ” 的 答案 是 很 简单 的 : 例如 可 以 检查 在 当前 纸 带 的 位 置 上 是 否 写 有 Y 或 者 N， 或 者 完全 
忽略 纸 带 内 容 ， 而 只 是 检查 它 的 最 终 状 态 是 接受 状态 〈 是 ") 还 是 非 接受 状态 (“ 否 ”)。 


前 几 章 的 所 有 判定 问题 都 是 可 判定 的 。 如 “有 限 状 态 自动 机 能 接受 这 个 字符 串 吗 ? ”和 
“这 个 正则 表达 式 匹 配 这 个 字符 串 吗 ? ”不 证 自明 是 可 判定 的 ， 因 为 我 们 已 经 写 了 Ruby 程 
序 以 便 通 过 直接 模拟 有 限 自 动机 解决 它们 。 给 我 们 足够 的 时 间 和 精力 ， 那 些 程序 可 以 费力 
地 转换 成 图 灵机 ， 而 且 因 为 它们 的 执行 包含 有 限 的 步骤 一 DEFA 模拟 的 每 一 步 会 消耗 输 
入 的 一 个 字符 ， 而 输入 的 是 有 限 数目 的 字符 一 一 它们 能 保证 总 是 停机 给 出 是 或 者 否 的 答案 
来 ， 因 此 原来 的 问题 都 满足 可 判定 的 条 件 。 




































































其 他 问题 有 些微 妙 。“ 这 个 下 推 自动 机 能 接受 这 个 字符 串 吗 ? ”可 能 看 起 来 不 是 可 判定 的 ， 
因为 我 们 已 经 看 到 用 Ruby 对 一 台 下 推 自 动机 的 直接 模拟 有 可 能 永远 循环 ， 也 不 会 给 你 答 
案 。 但 是 ， 恰 好 存在 一 种 方式 可 以 准确 地 计算 出 一 台 特 定 的 下 推 自动 机 为 了 接受 和 拒绝 一 

















个 给 定 长 度 的 输入 字符 串 要 经 过 多 少 模拟 步骤 ，” 因 此 问题 终究 是 可 判定 的 : 我 们 只 是 计 
算 所 需要 的 步 数 ， 对 那些 步骤 运行 模拟 ， 然 后 检查 输入 是 否 已 经 被 接受 了 。 


那 每 次 都 能 这 么 做 吗 ? 总 是 存在 一 种 聪明 的 方式 接近 一 个 癌 题 然 后 找到 一 种 方法 实现 一 人 台 
机 器 ， 或 者 一 个 程序 ， 让 它 保 证 能 在 有 限时 间 内 解决 这 个 问题 吗 ? 








好 吧 ， 不 行 ， 不 幸 的 是 不 行 。 有 许 一 一 无 限 多 一 一 多 判定 性 问题 而 且 大 量 的 问题 是 不 可 判 
定 的 : 没有 保证 能 停机 的 算法 能 解决 它们 。 这 些 问 题 中 每 一 个 都 是 不 可 判定 的 ， 不 是 因为 
我 们 还 没有 找到 合适 的 算法 ， 而 是 因为 问题 本 身 从 本 质 上 就 对 某 些 输入 不 可 能 解决 ， 而 我 
们 可 以 证 明永 远 也 不 会 找到 合适 的 算法 。 


8.3 停机 问题 

大 量 的 非 判 定性 问题 是 关于 机 器 和 程序 执行 过 程 中 的 行为 的 。 这 其 中 最 著名 的 就 是 停机 问 
题 ， 停 机 问题 要 解决 的 是 对 拥有 一 条 特定 纸 带 的 特定 图 灵机 判定 它 的 执行 是 否 能 够 停机 。 
感谢 通用 性 ， 我 们 可 以 把 同样 的 问题 用 更 实际 的 名 词 重 讲 一 人 帝 : 给 定 一 个 包含 Ruby 程序 
源 代 码 的 字符 串 ， 还 有 一 个 数据 的 字符 串 可 以 让 程序 从 标准 输入 中 读 取 ， 那 么 运行 这 个 程 
序 最 终 会 得 到 一 个 答案 作为 结果 还 是 只 会 无 限 循环 下 去 呢 ? 





























8.3.1 构建 停机 检查 器 
停机 问题 应 该 被 看 成 是 不 可 判定 的 ， 尽 管 原因 并 不 明显 。 对 于 一 个 可 回答 的 问题 写 出 程序 
是 比较 容易 的 。 下 面 是 一 个 不 管 它 的 输入 字符 串 是 什么 ， 都 能 确定 停机 的 程序 : 














input = $stdin.read 
puts input.upcase 


我 们 假设 $stdin.read 总 是 会 立即 返回 一 个 值 一 一 换 名 话说， 每 个 程序 的 标 
心 。 准 输入 是 有 限 的 和 不 会 阻塞 的 一 一 因为 我 们 关注 的 是 程序 的 内 部 行为 ， 而 不 


为 、 口 a 
全 是 它 与 操作 系统 的 交互 。 




















反 过 来 说 ， 对 源 代码 做 小 小 的 改动 就 可 以 产生 一 个 明显 永远 不 停机 的 程序 : 





input = $stdin.read 


while true 











注 11: 简 言 之 就 是 : 每 一 台 下 推 自动 机 都 有 一 个 上 下 文 无 关 文 法 ， 反 之 亦 然 ， 任 何 上 下 文法 都 可 以 用 乔 姆 
斯 基 范 式 重 写 ， 这 种 范式 下 的 任何 上 下 文 无 关 文 法 为 了 生成 长 度 为 n 的 字符 串 一 定 要 经 历 2n-1 步 。 
因此 我 们 可 以 把 原始 的 PDA 转 成 一 个 上 下 文 无 关 文法 ， 把 上 下 文 无 关 文法 重 写成 乔 姆 斯 基 范 式 ， 然 
后 把 这 个 上 下 文 无 关 文法 转换 回 PPA。 由 此 产生 的 下 推 自动 机 与 原来 的 机 器 能 识别 同样 的 语言 ， 但 
在 我 们 准确 地 知道 完成 它 需 要 多 少 步 了 。 



































尘 
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# 什么 也 不 做 


end 
puts input.upcase 


我 们 当然 可 以 写 出 一 个 停机 检查 器 来 区 分 这 两 种 情况 。 只 是 测试 程序 的 源 代码 是 否 含有 字 
符 串 while true 就 够 了 : 





def halts?(program, input) 
if program.include?('while true') 
false 
else 
true 
end 
end 


这 个 #halts? 方法 的 实现 在 下 面 两 个 示例 程序 中 会 给 出 正确 的 答案 





>> always = "input = $stdin.read\nputs input.upcase" 

=> "input = $stdin.read\nputs input.upcase" 

>> halts?(always, 'hello world') 

=> true 

>> never = "input = $stdin.read\nwhile true\n# do nothing\nend\nputs input.upcase" 
=> "input = $stdin.read\nwhile true\n# do nothing\nend\nputs input.upcase" 

>> halts?(never, 'hello world') 

=> false 


但 #halts? 对 其 他 程序 很 可 能 是 错 的 。 例 如 ， 存 在 这 样 的 程序 ， 它 们 的 停机 行为 依赖 于 它 
们 的 输入 值 : 


input = $stdin.read 


if input.include?('goodbye') 
while true 
# 什么 也 不 做 
end 
else 
puts input.upcase 
end 


因为 知道 搜索 什么 ， 所 以 我 们 可 以 总 是 扩展 停机 检查 器 来 处 理 这 样 的 特殊 情况 


def halts?(program, input) 
if program.include?('while true') 
if program.include?('input.include?(\'goodbye\')') 
if input.include?('goodbye') 
false 
else 
true 
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end 
else 
true 
end 
end 


现在 我 们 有 了 一 个 检查 器 ， 它 能 对 三 个 程序 和 任意 可 能 的 输入 字符 串 给 出 正确 的 答案 : 





>> halts?(always, 'hello world') 

=> true 

>> halts?(never, 'hello world') 

=> false 

>> sometimes = "input = $stdin.read\nif input.include?('goodbye')\nwhile true\n 
# 执行 nothing\nend\nelse\nputs input.upcase\nend" 

=> "input = $stdin.read\nif input.include?('goodbye')\nwhile true\n# do nothing\n 
end\nelse\nputs input.upcase\nend" 

>> halts?(sometimes, 'hello world') 

=> true 

>> halts?(sometimes, 'goodbye world') 

=> false 


我 们 可 以 像 这 样 无 限 继 续 下 去 ， 增 加 更 多 的 检查 和 更 多 的 特殊 情况 ， 以 支持 对 实例 程序 的 
所 有 扩展 ， 但 我 们 永远 都 无 法 得 到 判定 任意 程序 是 否 会 停机 的 全 部 问题 的 答案 。 一 个 暴力 
的 实现 可 能 会 越 来 越 准确 ， 但 总 是 会 有 宣 点 ;简单 的 查找 特殊 语法 模式 的 方法 不 可 能 满足 
所 有 的 程序 。 


让 #halts? 能 在 通常 情况 下 对 任何 可 能 的 程序 和 输入 都 工作 看 起 来 有 些 困 难 。 如 果 一 个 程 
序 含 有 任何 循环 一 一 不 管 是 显 式 的 ， 如 while 循环 ， 或 者 隐 式 的 ， 如 递归 方法 调用 一 一 那 
它 都 有 可 能 一 直 运 行 下 去 ， 预 测 对 于 给 定 输 入 的 任何 东西 都 需要 对 程序 含义 的 熟练 分 析 。 
作为 人 类 ， 我 们 可 以 立即 看 出 来 下 面 这 个 程序 总 是 能 停机 : 



































input = $stdin.read 
output = "" 


n = input.length 

until n.zero? 
output = output + '*" 
n=n-1 

end 


puts output 











但 是 为 什么 它 总 是 能 停机 呢 ? 当然 不 是 因为 任何 直接 的 语法 原因 。 解 释 是 IO#read 总 会 
返回 一 个 String， 而 String#length 总 会 返回 一 个 非 负 的 Integer， 并 且 不 断 对 非 负 的 
Integer 调用 - (1) 最 终 总 是 会 产生 一 个 对 象 ， 它 的 #zero? 方法 会 返回 true。 这 个 推 
理 链 很 微妙 而 且 对 于 小 的 修改 会 高 度 敏感 ， 如 果 循 环 中 的 语句 n=n-1 变 成 n=n-2， 程 序 
将 只 会 在 偶数 长 度 个 输入 时 才 会 停机 。 停 机 检查 器 需要 知道 所 有 这 些 关 于 Ruby 和 数 的 
事实 ， 还 要 知道 如 何 把 事实 连 到 一 起 以 便 对 这 种 程序 的 判定 能 准确 。 这 样 的 检查 器 需要 
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AS ，#evaluate 看 它 是 否 会 停机 是 很 诱 人 的 ， 但 那样 做 没有 好 处 : 如 果 程 序 不 停 
”机 ，#evaluate 将 会 永远 运行 下 去 ， 而 不 管 我 们 等 多 久 ， 都 不 会 从 #halts? 
获得 任何 应 答 。 任 何 可 以 依赖 的 停机 检测 算法 都 需要 在 有 限 的 时 间 内 通过 
检查 和 分 析 程 序 的 文本 来 生成 确定 的 答案 ， 而 不 是 单纯 依靠 运行 程序 和 


等 待 。 


4 最 基本 的 困难 是 不 实际 执行 一 个 程序 很 难 预测 它 将 会 干什么 。 运 行程 序 
A 
人 


























8.3.2 ”永远 不 会 有 结果 

好 吧 ， 直 觉 告 诉 我 们 #halts? 很 难 正确 实现 ， 但 那 并 不 意味 着 停机 问题 是 不 可 判定 的 。 有 
大 量 的 难题 (例如 写 出 #evaluate) 被 证 明 只 要 付出 足够 的 努力 和 创造 力 ， 都 是 能 解决 的 。 
如 果 停 机 问题 是 不 可 判定 的 ， 那 就 意味 着 #halts? 不 止 是 极端 困难 ， 而 是 不 可 能 写 出 来 。 








如 何 才 能 知道 #halts? 的 恰当 实现 不 可 能 存在 呢 ? 如 果 它 仅仅 是 一 个 工程 问题 ， 为 什么 我 
们 不 能 投入 大 量 的 程序 员 ， 并 最 终 获 得 一 个 解决 方案 呢 ? 











1. 好 得 不 真实 

我 们 假设 停机 问题 是 可 判定 的 。 在 这 个 假想 的 世界 里 ， 写 一 个 #halts? 的 完整 实现 是 可 能 
的 ， 因 此 对 #halts?(program, input) 的 调用 在 任何 program 和 input 下 ， 总 是 返回 true 或 
者 false， 并 且 如 果 以 标准 输入 的 input 运行 ， 这 个 答案 总 是 能 正确 地 预测 program 是 否 能 
停机 。 方 法 #halts? 的 原始 结构 可 能 像 下 面 这 样 : 








def halts?(program, input) 














# 解析 程序 

# 分 析 程 序 

# 如 果 程 序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 

















如 果 可 以 写 #halts?， 那 么 我 们 可 以 构建 does_it_haltrb， 这 个 程序 能 读 取 另 一 个 程序 ( 作 
为 输入 ) ， 并 在 读 取 到 空 字符 串 的 时 候 根 据 那个 程序 是 否 停机 来 输出 yes 或 者 no: " 


def halts?(program, input) 














# 解析 程序 

# 分 析 程 序 

# 如 果 程 序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 


def halts on empty?(program) 








注 12: 空 字符 串 的 选择 并 不 重要 ， 只 是 任意 的 一 个 固定 输入 。 这 个 设计 是 在 自 包含 的 程序 上 运行 does_it_ 
halt.rb， 程 序 不 从 标准 输入 读 取 任何 东西 ， 因 此 输入 是 什么 并 不 重要 。 
































A 
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halts?(program, '') 
end 


program = $stdin.read 


if halts on empty?(program) 
print 'yes’ 
else 
print 'no' 
end 
有 了 does_it_halt.rb 之 后 , 就 可 以 使 用 它 解 决 非常 难 的 问题 。 考 虑 一 下 1742 年 克里斯蒂 安 : 
哥 德 巴 赫 提出 的 著名 论断 : 
任何 一 个 大 于 2 的 整数 都 可 以 写成 两 个 质数 之 和 。 
这 就 是 哥 德 巴 赫 猜想 ,因为 还 没有 人 能 证 明 它 是 真 还 是 假 ， 所 以 它 很 车 名。 有 证 据 表 明 它 
是 真 的 ,因为 任 选 的 一 个 偶数 总 是 可 以 分 成 两 个 质数 一 一 12=5+7、34=3+31、567 890 
=7 + 567 883， 等 等 一 一 已 经 检查 过 它 对 4 和 4 000 000 000 000 000 000 之 间 的 所 有 偶 
数 都 成 立 。 但 存在 无 限 多 个 偶数 ， 因 此 没有 计算 机 能 把 它们 都 检查 出 来 ， 对 每 个 偶数 一 
定 可 以 用 这 种 方式 拆 分 也 人 没有 已 知 的 证 明 。 尽 管 可 能 性 小 ， 但 仍 有 可 能 存在 某 个 非常 大 的 
偶数 不 是 两 个 质数 的 和 。 





证 明 哥 德 巴 赫 猜 想 是 数论 的 圣杯 之 一 。2000 年 ， 英 国 费 伯 出 版 社 悬 党 100 万 美元 给 能 证 明 
哥 德 巴赫 猜想 的 人 。 但 等 一 下 : 我 们 已 经 有 了 能 发 现 这 个 猜想 是 真 的 工具 了 啊 ! 只 需要 写 
一 个 程序 ， 搜 索 反 例 即 可 : 








require 'prime' 


def primes less than(n) 
Prime.each(n - 1).entries 
end 


def sum of two primes?(n) 

primes = primes less than(n) 

primes.any? { |al primes.any? { |b| a +b ==n}} 
end 


n=4 


while sum of two primes?(n) 


n=n+2 
end 
print n 




















这 在 哥 德 巴赫 猜想 的 真实 性 和 一 个 程序 的 停机 行为 之 间 建 立 了 联系 。 如 果 猜 想 是 真 的 ， 这 
个 程序 将 永远 无 法 找到 反例 ， 不 管 它 计 数 到 多 少 ， 因 此 它 将 会 永远 循环 下 去 ， 如 果 猜 想 是 
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假 的 , n 将 最 终 被 赋予 一 个 偶数 值 ， 这 个 偶数 值 不 是 两 个 质数 的 和 ， 并 且 程 序 将 会 停机 。 
因此 我 们 只 需要 把 它 保 存 成 goldbach.rb 并 运行 ruby does_it_halt.rb < goldbach.rb， 以 查 明 
这 是 否 是 一 个 停机 程序 ， 而 那 将 告诉 我 们 哥 德 巴赫 猜想 是 否 是 真 的 。100 万 美元 是 我 们 的 
可 必 








好 了 ， 很 明显 这 好 得 都 不 真实 了 。 写 出 能 准确 预测 goldbach.rb 行为 的 程序 将 会 要 求 精 通 超 
越 我 们 当前 理解 的 数论 知识 。 数 学 家 已 经 工作 了 几 百 年 试图 证 明 或 者 证 伪 哥 德 巴赫 猜想 ， 
一 群 贪得无厌 的 软件 工程 师 构建 出 一 个 Ruby 程序 ， 奇 迹 般 地 不 止 解决 这 个 问题 ， 还 能 解 
决 可 以 表达 成 循环 程序 的 任何 未 解数 学 猜想 是 不 可 能 的 。 


2. 根本 就 不 可 能 

到 目前 为 止 我 们 已 经 看 到 了 很 强 的 证 据 表 明 停 机 问题 是 不 可 判定 的 ， 但 还 没有 看 到 确定 性 
的 证 明 。 我 们 的 直觉 可 能 是 只 通过 把 哥 德 巴赫 猜想 转 成 一 个 程序 就 证 明 或 者 推翻 它 是 不 可 
能 的 ， 但 计算 有 时 候 是 非常 违背 直觉 的 ， 因 此 我 们 不 应 该 被 多 么 不 可 能 的 东西 说 服 。 如 果 
停机 问题 确实 是 不 可 判定 的 ， 而 不 是 简单 的 难以 判定 ， 我 们 应 该 能 够 证 明 它 。 
















































































下 面 是 为 什么 #halts? 永远 不 能 工作 。 如 果 它 工作 ， 我 们 就 能 构建 一 个 新 的 方法 #halts_ 
on_itself?， 这 个 方法 调用 #halts? 以 决定 一 个 程序 在 把 它 自己 的 源 代码 作为 输入 运行 时 
会 做 什么 :" 











def halts on itself?(program) 
halts?(program, program) 
end 

















就 像 #halts? 一 样 ，#halts_on_itself? 方法 总 会 结束 并 返回 一 个 布尔 值 : 如 果 program 以 
自己 作为 输入 时 能 停机 就 是 true， 如 果 永 远 循 环 就 是 false。 


给 定 #halts? 和 #halts_on_itself? 的 实现 ， 我 们 可 以 写 一 个 叫 作 do_the_opposite.rb 的 程序 : 


def halts?(program, input) 

# 解析 程序 

# 分 析 程 序 

# 如 果 程 序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 











def halts on itself?(program) 
halts?(program, program) 
end 


program = $stdin.read 


if halts on itself?(program) 
while true 

















注 13: 费 伯 出 版 社 的 奖金 在 2002 年 过 期 了 ,但 今天 任何 能 给 出 证 明 的 人 仍然 将 在 明星 数学 家 圈子 中 名 利 双 收 。 


注 14: 这 是 对 8.1.4 节 中 #evaluate_on_itself 的 重 现 ， 只 是 用 #halts? 赫 换 了 #evaluate。 
































A 
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# 什么 也 不 做 
end 
end 


这 段 代码 从 标准 输入 中 读 取 program， 查 明 如 果 自 身 为 输入 时 它 是 否 会 停机 ， 并 立即 做 相 
反 的 动作 : 如 果 program 能 停机 ，do_the_opposite.rb 永远 会 人 循环， 如果 program 永远 循环 ， 
do_the_opposite.rb 会 停机 。 





现在 ，ruby do_the_opposite.rb < do_the_opposite.rb 会 做 些 什 么 呢 ? “就 像 我 们 之 前 用 
does_it_say_no.rb 看 到 的 那样 ， 这 个 问题 创造 了 不 可 避免 的 矛盾 。 





在 给 定 do_the_opposite.rb 的 源码 作为 参数 时 ， 方 法 #halts_on_itself? 要 么 返回 true 要 
么 返回 false。 如 果 它 用 返回 true 表示 停机 程序 ， 那 么 ruby do_the_opposite.rb < do_the_ 
opposite.rb 将 会 永远 循环 下 去 ， 这 意味 着 #halts_on_itself 是 错误 的 。 另 一 方面 ， 如 果 
#halts_on_itself? 返回 false，make do_the_opposite.rb 会 立刻 停机 ， 又 一 次 与 #halts_ 
on_itself? 的 预测 矛盾。 


这 里 错 在 选择 一 个 无 辜 的 小 程序 ， 作 为 #halts 的 代码 并 依 
赖 它 的 答案 。 我 们 真正 展示 的 是 在 用 RE 既 作为 program 又 作为 input 的 参 
数 时 ，#halts? 不 能 返回 一 个 满意 的 答案 ; 不管 如 何 努 力 工作 ， 它 产生 的 任何 结果 都 是 错 
的 。 那 意味 着 对 于 #halts?， 任 何 真 正 的 实现 只 存在 两 种 可 能 的 命运 


。 给 出 错误 的 答案 ， 如 即使 do_the_opposite.rb 能 停机 也 预测 它 永远 循环 下 去 ( 反 过 来 也 
是 这 样 ) ; 

。 永远 循环 而 且 从 来 也 不 会 返回 任何 答案 ， 就 像 ruby does_it_say_no.rb < does_it_say_no.rb 
里 #evaluate 做 的 那样 。 












































因此 一 个 #halts? 完全 正确 的 实现 永远 不 会 存在 : 对 于 输入 ， 它 要 么 做 出 错误 的 预测 ， 要 
么 根本 就 做 不 出 预测 。 





回忆 一 下 可 判定 性 的 定义 : 


一 个 判定 问题 如 果 存在 一 个 算法 能 保证 对 于 任何 可 能 的 输入 都 能 在 有 限时 间 内 
解决 ， 这 个 问题 就 是 可 判定 的 。 


我 们 应 该 证 明了 写 一 个 Ruby 程序 完全 解决 停机 问题 是 不 可 能 的 ， 而 且 既 然 Ruby 程序 与 图 
灵机 等 价 ， 所 以 图 灵机 也 是 不 可 能 的 。 印 奇 一 图 灵 论 题 说 的 是 所 有 的 算法 都 能 由 一 台 图 灵 
机 执行 ， 因 此 如 果 不 存在 能 解决 停机 问题 的 图 灵机 ， 也 不 会 存在 算法 ， 换 句 话 说， 停机 问 
题 是 不 可 判定 的 。 














注 15: 或 者 等 价 地 说 : 如 果 我 们 用 do_the_opposite.rb 的 源 代码 作为 它 的 参数 调用 它 ，#halts_on_itself? 会 
返回 什么 呢 ? 
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8.4 其 他 不 可 判定 的 问题 


能 轻松 定义 的 问题 ， 计 算 机 却 无 法 解决 ， 真 令 人 诅 形 。 但 是 ， 这 个 特定 的 问题 相当 抽象 ， 
而 且 我 们 用 来 描绘 它 的 do_the_opposite.rb 程序 也 不 实际 而 且 做 作 。 我 们 想 要 #halts? 实际 执 
行 ， 或 者 作为 一 个 现实 世界 应 用 的 一 部 分 写 一 个 do_the_opposite.rb 的 程序 看 起 来 不 太 可 能 。 
或 许 我 们 可 以 无 视 不 可 判定 性 ， 将 其 作为 一 个 学 术 “ 玩 具 ”， 然 后 继续 我 们 的 生活 。 

















遗憾 的 是 ， 没 那么 简单 ， 因 为 停机 问题 不 是 唯一 的 不 可 判定 问题 。 我 们 日 常 构建 软件 的 过 
程 中 可 能 想 要 解决 大 量 问题 ， 而 它们 的 不 可 判定 性 对 于 自动 化 工具 和 过 程 的 实际 限制 非常 
重要 。 

















来 看 个 小 例子 。 假 设 我 们 已 经 接受 了 一 个 任务 ， 要 开发 一 个 输出 “hello world' 的 Ruby 程 
序 。 听 起 来 相当 简单 ， 但 按照 长 期 以 来 的 固有 模式 ， 我 们 “还 要 开发 一 个 自动 化 工具 ， 它 
能 可 靠 地 判定 是 否 存在 一 个 特定 的 程序 在 提供 一 个 特定 的 输入 时 能 输出 hello world。” 有 
了 这 个 工具 ， 我 们 可 以 分 析 最 终 的 程序 ， 然 后 检查 它 是 否 做 了 应 该 做 的 事 | 




















一 


“二 
上 月。 





现在 ， 假 设 我 们 成 功 开发 了 一 个 方法 #prints_hello_wor1ld? ， 它 能 正确 地 对 所 有 程序 做 出 
判断 。 忽 略 掉 实 现 细节 ， 方 法 会 是 这 种 普遍 的 形式 : 








def prints hello world?(program, input) 

# 解析 程序 

# 分 析 程序 

# 如 果 程 序 打印 "hello wor1ld"， 就 返回 true， 否 则 返回 false 
end 








写 完 最 初 的 程序 之 后 ， 我 们 可 以 使 用 却 rints_hello_world? 来 验证 它 做 了 正确 的 事情 ， 如 
果 做 得 对 ， 就 把 它 签 和 到 源 代 码 里 ， 发 邮件 给 老板 ， 然 后 所 有 人 都 会 很 高 兴 。 但 情况 甚至 
更 好 ， 因 为 还 能 使 用 rints_hello_world? 实现 另 一 个 有 趣 的 方法 : 





def halts?(program, input) 
hello world program = %0{ 
program = #{program.inspect} 
input = $stdin.read 
evaluate(program, input) # evaluate program, ignoring its output 
print 'hello world’ 


} 


prints_hello world?(hello world program, input) 
end 





注 16: 当然 是 “负责 任 的 软件 工程 专业 人 员 ”。 
注 17: 如 果 程 序 没有 实际 从 $stdin 读 取 任 何 东 西 ， 输 入 可 能 是 无 关 的 ， 但 为 了 完整 性 和 一 致 性 我 们 会 把 它 
包含 进来 。 




















A 
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寺 


‰ 语法 引用 字符 串 的 方式 与 2 一 样 ， 之 后 会 执行 替换 ， 因 此 故 program. 
人 Q 4 、inspect} 会 被 一 个 包含 progran 值 的 Ruby 字符 串 替换 掉 。 


， 
4 人， 














我 们 新 版 本 的 #halts? 通过 构建 一 个 特殊 的 程序 hello_world_program 来 工作 ， 它 主要 干 两 
件 事情 : 


(1) 用 标准 输入 中 的 input 为 参数 对 program 求 值 ; 
(2) 输出 hello world。 




















hello_world_progranm 此 时 执行 只 有 两 种 可 能 的 结果 : 要 么 evaluate(program，input) 成 功 
结束 ， 在 这 种 情况 下 hello world 将 会 被 输出 ， 要 么 evaluate(program，input) 将 会 永远 
循环 ， 也 就 根本 没有 输出 。 

把 这 个 程序 提供 给 #prints_hello_world?， 以 查 明 那 两 个 结果 中 哪个 将 会 发 生 。 如 果 
#prints_hello_world? 返回 true， 那 意味 着 evaluate(program，input) 最 终 将 结束 ， 并 人 允许 
hello world 输出 ， 因 此 #halts? 返回 true 以 标识 这 个 程序 对 于 input 会 停机 。 相 反 ， 如 果 
#prints_hello_world? 返回 false， 那 一 定 是 因为 hello_world_program 永远 也 无 法 到 达 它 的 
最 后 一 行 ， 因 此 #halts 返回 false， 以 此 来 说 明 evaluate(program，input) 会 永远 循环 。 


我 们 对 #halts? 的 新 实现 表明 停机 问题 可 以 规约 成 检查 一 个 程序 是 否 会 输出 hello world 
的 问题 。 换 句 话 说， 任何 计算 #prints_hello_world? 的 算法 都 能 改 成 计算 #halts? 的 算法 。 


我 们 已 经 知道 一 个 可 工作 的 #halts? 不 可 能 存在 ， 因 此 明显 的 结论 是 #prints_hello_ 
world? 的 完整 实现 也 不 可 能 存在 。 如 果 不 可 能 实现 ， 邱 奇 一 图 灵 论 题 表明 不 存在 这 样 的 算 
法 ， 因 此 “这 个 程序 是 否 会 输出 hello world ? ”是 另 一 个 不 可 判定 的 问题 。 


在 现实 中 ,没有 人 关心 自动 检查 一 个 程序 是 否 会 输出 特定 的 字符 串 ， 但 这 个 不 可 判定 性 证 
明 的 结构 指向 了 某 种 更 大 更 普遍 的 情况 。 我 们 需要 构建 一 个 程序 ， 只 要 其 他 某 个 程序 停机 
了 ， 它 就 展示 “print hello world” 属 性 (输出 hello world) ， 这 对 展示 不 可 判定 性 足够 了 。 
无 法 重用 这 种 方法 的 所 有 程序 行为 的 属性 中 ， 有 我 们 确实 关心 的 属性 吗 ? 

没有 。 这 是 Rice 定理 : 程序 行为 的 任何 非 平 几 性 质 都 是 不 可 判定 的 ， 因 为 停机 问题 总 是 能 
被 规约 成 判定 这 个 属性 是 否 为 true 的 问题 ， 如 果 我 们 能 发 明 一 个 算法 来 判定 那个 属性 ， 就 
能 使 用 它 来 构建 另 一 个 算法 来 判定 停机 问题 ， 而 这 是 不 可 能 的 。 



















































































概括 地 讲 ， 一 个 “ 非 平凡 的 属性 ”是 对 程序 做 什么 而 不 是 程序 怎么 做 的 一 
4 4 、 个 要 求 。 例 如 ，Rice 定理 对 于 像 “这 个 程序 的 源 代码 包含 字符 串 "reverse 
外 ， 吗 ? ”这 样 的 问题 并 不 适用 ， 因 为 这 是 一 个 实现 细节 ， 能 在 不 改变 程序 外 部 
可 视 行为 的 前 提 下 重 构 掉 。 换 句 话说 ， 像 “这 个 程序 是 输出 它 输入 的 逆向 

吗 ? ”这 样 的 语义 性 质 是 在 Rice 定理 范围 内 的 ， 从 而 是 不 可 判定 的 。 









































Rice 定理 告诉 我 们 存在 大 量 关 于 一 个 程序 执行 时 会 干什么 的 不 可 判定 的 问题 。 
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8.5 令 人 肖 形 的 暗示 
不 可 判定 性 是 生命 中 麻烦 的 一 个 事实 。 停 机 问题 令 人 失望 ， 因为 它 表 明 我 们 无 法 拥有 一 
切 : 我 们 想 要 的 是 能 力 不 受 限制 的 通用 编程 语言 ， 但 还 想 要 写 出 程序 产生 一 个 不 会 陷入 无 
限 循 环 的 结果 ， 或 者 至 少 是 子 例 程 作为 某 个 更 大 的 长 期 运行 任务 的 一 部 分 能 停机 (参见 
8.1.4 节 “ 超 长 时 间 运 行 的 计算 ”部 分 )。 














2004 年 的 一 篇 经 典 论文 对 此 做 出 了 简要 总 结 : 
由 于 停机 问题 ， 语 言 设计 中 存在 着 二 分 法 。 根 据 编程 规范 ， 我 们 必须 在 这 两 者 间 
选择 。 


一 一 在 这 种 语言 中 所 有 知道 的 程序 都 要 终止 。 


A. 安 全 
B. 普遍 性 一 一 在 这 种 语言 中 ， 我 们 可 以 写 : 


i 所 有 结束 的 程序 ; 
ii. 不 能 结束 的 病态 程序 。 


并 且 ， 给 出 一 个 任意 的 程序 ， 我 们 一 般 无 法 说 出 它 是 (i) 还 是 (ii)。 
50 年 前 ， 在 电子 计算 发 展 初期 ， 我 们 选择 (B)。 





David Turner，7otal Functional Programming (完全 巴 数 式 编程 ， 


http://www.jucs.org/jucs_10_7/total_functional_programming) 


是 的 ， 我 们 不 愿意 写 出 病态 的 程序 来 ， 但 那 仅 仅 是 运气 不 好 。 没 法 识别 任意 的 一 个 程序 是 
否 病态 ， 因 此 我 们 不 可 能 在 不 牺牲 通用 性 的 前 提 下 完全 避免 写 出 病态 程序 。” 








吉 





Rice 定理 的 暗示 也 是 令 人 诅 形 的 : 不 止 “ 程 序 是 否 会 停机 ”这 个 问题 是 不 可 判定 的 ，“ 程 
序 是 否 做 了 我 想 让 它 做 的 ”也 是 不 可 判定 的 。 我 们 生活 的 宇宙 当中 ， 没 法 构建 一 台 机 器 色 
准确 预测 一 个 程序 是 否 能 输出 hello world， 是 否 会 计算 一 个 特定 的 数学 函数 或 者 是 否 外 
做 一 个 特定 的 操作 系统 调用 ， 而 这 就 是 它 的 运行 方式 。 





GCC CS 








那 是 令 人 诅 霄 的 ， 因 为 能 够 机 械 地 检查 程序 性 质 实在 是 非常 有 用 的 ， 有 了 一 个 工具 能 判定 
程序 是 否 遵 守 它 的 规范 或 者 含有 任何 的 bug 之 后 ， 现 代 软 件 的 可 靠 性 将 会 提高 。 那 些 性 质 
可 能 对 于 个 体 程序 是 可 以 机 械 地 检查 出 来 的 ， 但 除非 它们 通常 都 能 检查 出 来 ， 不 然 我 们 将 
永远 不 能 信任 机 器 来 做 这 些 工作 。 


例如 ， 假 如 我 们 发 明了 一 个 新 的 软件 平台 ， 并 且 决 定 通 过 在 线 商店 一 一 一 个 “应 用 程序 的 
超市 ” 卖 兼容 程序 来 赚钱 ， 如 果 你 喜欢 一 代表 我 们 平台 的 第 三 方 开发 者 。 我 们 想 要 顾客 





























注 18: 完全 编程 语言 是 对 这 个 问题 的 法 在 解决 方案 ,但 到 目前 为 止 它们 还 没有 开始 应 用 ， 或 许 是 因为 它们 
比 起 通常 的 语言 更 难 理解 吧 。 
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能 充满 自信 地 购物 ， 因 此 决定 只 买 满足 某 些 条 件 的 程序 : 它们 一 定 不 能 骨 溃 ， 它 们 一 定 不 
能 调用 私有 的 API， 并 且 它 们 一 定 不 能 执行 从 网 上 下 载 的 任意 代码 。 





成 千 上 万 的 开发 者 开始 向 我 们 提交 代码 的 时 候 ， 我 们 如 何 检查 每 一 个 应 用 是 否 满足 要 求 
呢 ? 如 果 我 们 使 用 自动 系统 检查 每 一 个 提交 的 规范 程度 ， 那 将 会 节约 大 量 的 时 间 和 金钱 ， 
但 感谢 不 可 判定 性 ， 不 可 能 构建 一 个 准确 完成 这 个 任务 的 系统 。 我 们 只 能 雇用 一 小 了 从 人 运 
行 这 些 程序 、 反 编译 并 且 检 测 操作 系统 来 测量 程序 的 动态 行为 ， 除 此 之 外 别 无 他 法 。 


人 工 检查 速度 慢 ， 成 本 高 ， 容 易 出 错 ， 而 且 每 个 程序 只 能 运行 一 小 段 时 间 ， 提 供 自 己 动态 
行为 的 有 限 片段 。 因 此 即使 没 和 人 犯错 误 ， 通 常 一 些 不 可 预计 的 东西 也 会 出 现 ， 然 后 我 们 就 
会 有 大 量 气愤 的 顾客 。 多 谢 了 ， 不 可 判定 性 。 


在 所 有 这 些 不 便 之 下 有 两 个 基础 问题 。 第 一 个 是 我 们 没有 能 力 预 测 程序 执行 的 时 候 会 发 生 
什么 ， 措 清楚 一 个 程序 做 什么 的 唯一 通用 方法 就 是 真正 运行 它 。 尽 管 一 些 程序 足够 简单 ， 
行为 直接 是 可 预测 的 ， 但 仅仅 通过 分 析 它 们 的 产 代 码 ， 通 用 语言 总 是 会 允许 行为 不 可 预测 
的 程序 存在 。” 











第 二 个 问题 是 ， 在 我 们 确实 决定 运行 程序 的 时 候 ， 设 有 可 靠 的 方式 知道 它 多 入 能 运行 完 。 
唯一 通用 的 解决 方案 是 运行 程序 然后 等 它 执行 ， 但 既然 我 们 知道 通用 语言 的 程序 有 可 能 不 
停机 永远 循环 下 去 ， 那 么 总 是 存在 一 些 程序 无 论 等 待 多 久 都 运行 不 完 。 


8.6 ”发生 上 述 情况 的 原因 


在 这 一 章 里 ， 我 们 已 经 看 到 所 有 通用 系统 都 足够 强大 ， 可 以 引用 自身 。 程 序 对 数字 进行 运 
算 ， 数 字 可 以 表示 字符 串 ， 而 一 个 程序 的 指令 只 用 字符 串 写 下 来 的 ， 因 此 程序 完全 能 够 对 
它们 自己 的 源 代码 进行 运算 。 


自 引 用 能 力 使 得 写 出 能 准确 预测 程序 行为 的 程序 成 为 不 可 能 的 事情 。 一 旦 一 个 特别 的 行为 
检查 程序 写 完 了 ， 我 们 总 是 能 构建 一 个 更 大 的 程序 打败 它 : 新 程序 把 这 个 检测 器 当 作 一 个 
子 例 程 ， 检 查 它 自身 的 源 代 码 ， 然 后 立即 做 与 检测 器 要 做 的 相反 的 事情 。 这 些 自我 矛盾 的 
程序 比 我 们 实际 写 出 来 的 一 些 东 西 更 奇特 ， 但 它们 只 是 一 个 征兆 ， 而 不 是 六 在 问题 的 根 
因 : 通常 ， 程序 行为 过 于 强大 而 无 法 准确 预测 。 


























过 
Se 人 类 语言 有 类 似 的 能 力 和 问题 。 "这 个 句子 是 一 个 谎言 ”( 说 谎 者 悖 论 ) 是 
心 。 一 句 话 ， 它 不 可 能 是 true 也 不 可 能 是 false 的 ， 就 像 我 们 在 8.1.5 市 中 看 到 

全 的， 任何 计算 机 程序 都 可 以 在 不 需要 任何 特别 语言 特性 的 情况 下 引用 自身 。 




















注 19: Stephen Wolfram 为 这 种 不 运行 程序 就 无 法 预测 程序 行为 的 思想 起 名 叫 计算 不 可 约 。 
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一 言 以 蔽 之 ,程序 行为 这 么 难 预测 有 两 个 原因 。 
(1) 任何 拥有 足够 能 力 引 用 自身 的 系统 ， 都 无 法 正确 回答 每 一 个 关于 自身 的 问题 ”。 我 们 


总 是 可 以 构建 一 个 
题 ， 我 们 需要 跳出 自 














和 旬 do_the_opposite.rb 的 程序 ， 系 统 无 法 预测 它 的 行为 。 为 了 避免 这 个 问 





引用 系统 使 用 一 个 不 同 的 更 强大 的 系统 回答 关于 它 的 问题 。 


(2) 但 是 对 于 通用 编程 语言 ， 不 存在 更 强大 的 系统 供 我 们 升级 。 吨 奇 一 图 灵 论 题 表明 我 们 
发 明 的 对 程序 行为 进行 预测 的 任何 可 用 算法 ， 都 能 由 一 个 程序 执行 ， 因 此 我 们 无 法 超越 通 
用 系统 的 能 力 。 


8.7 ”处 理 不 可 计算 性 


写 一 个 程序 的 所 有 要 点 就 是 让 计算 机 做 有 用 的 事情 。 作 为 程序 员 ， 我 们 该 如 何 应 对 无 法 检 


讽 


C= 














程序 是 否 正确 工作 这 个 事实 呢 ? 


拒绝 是 一 个 吸引 人 的 选择 : 忽略 整个 问题 。 如 果 能 自动 校 验 程序 行为 当然 好 ， 但 我 们 不 能 ， 
所 以 只 是 期 望 做 到 最 好 ， 而 永远 不 要 检查 一 个 程序 在 正确 地 完成 它 的 工作 。 











但 这 属于 反应 过 度 ， 因 为 情况 没有 听 起 来 那么 坏 。Rice 定理 并 不 意味 着 分 析 程 序 不 可 能 ， 
而 只 是 我 们 不 可 能 写 出 一 个 不 平凡 的 总 是 停机 并 产生 正确 答案 的 分 析 器 。 就 像 我 们 在 8.3.1 
节 看 到 的 ， 没 有 什么 可 以 阻止 我 们 写 一 个 工具 来 为 某 些 程序 给 出 正确 答案 ， 只 是 我 们 得 承 
认 总 是 会 存在 其 他 程序 要 么 给 出 错误 答案 要 么 永远 循环 不 返回 任何 东西 。 

不 考虑 不 可 判定 性 ， 下 面 是 一 些 分 析 和 预测 程序 行为 的 实用 方法 。 


问 一 些 不 可 判定 的 问题 ， 但 如 果 找 不 到 答案 就 放弃 。 例 如 ， 为 了 检查 一 个 程序 是 否 会 输 





























出 特定 的 字符 串 ， 




















我 们 可 以 运行 程序 然后 等 待 ， 如 果 在 特定 的 时 间 〈 比 如 10 秒 ) 内 没 


有 输出 那个 字符 串 ， 我 们 就 结束 程序 并 假设 它 没有 用 。 我 们 有 可 能 会 扔 掉 一 个 11 秒 之 





后 才 产 生 期 望 输 





8 的 程序 ， 但 在 很 多 情况 下 ， 这 种 风险 是 可 以 接受 的 ， 特 别 是 从 自身 来 














说 我 们 不 需要 运行 缓慢 的 程序 。 








把 所 问 的 几 个 小 


问题 答案 汇总 起 来 ， 就 能 为 一 个 更 大 的 问题 提供 经 验 性 的 证 据 。 在 


执行 自动 化 验收 测试 时 ， 我 们 通常 不 能 为 每 一 个 可 能 的 输入 检查 程序 是 否 做 了 正确 
的 事情 ， 但 我 们 可 以 尝试 为 有 限 的 输入 样本 运行 这 个 程序 来 看 会 发 生 什 么 。 每 一 个 
测试 运行 都 对 那个 特例 程序 如 何 运 行 给 出 了 信息 ， 并 且 我 们 可 以 使 用 这 个 信息 提高 





对 程序 通常 可 能 








行为 的 信心 。 有 可 能 还 有 未 测试 的 输入 ， 这 会 引起 完全 不 同 的 行 


为 ， 但 只 要 测试 用 例 为 大 多 数 现实 输入 的 表示 完成 了 工作 ， 我 们 就 可 以 坦然 生活 。 
这 个 方法 的 另 一 个 例子 是 单元 测试 的 使 用 ， 单 元 测试 是 为 了 验证 小 段 程序 行为 ， 而 不 是 





注 20: 这 大 致 就 是 司 








theorems 内 容 。 


[德尔 第 一 不 完备 定理 (http://en.wikipedia.org/wiki/G%C3%B6del%27s_incompleteness_ 
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把 程序 作为 整体 来 验证 。 一 个 良好 分 离 的 单元 测试 专 广 于 简单 单元 代码 的 性 质 ， 并 通过 
把 程序 的 其 他 部 分 表示 成 测试 替代 物 (存根 和 模拟 对 象 ) 来 做 出 假设 。 使 用 小 段 容易 理 
解 代码 的 单个 单元 测试 可 能 会 简单 而 且 快 速 ， 把 任何 一 个 将 会 永远 运行 或 者 给 出 误导 答 
案 的 测试 风险 最 小 化 。 


通过 这 种 方式 对 程序 的 所 有 片段 进行 单元 测试 ， 我 们 可 以 建立 一 个 类 似 数学 证 明 的 假 
设 和 影响 链 :“ 如 果 片 段 A 工作 ， 那 么 片段 B 能 工作 ， 而 如 果 片 段 B 工作 ， 那 么 片段 C 
能 工作 。 判定 所 有 这 些 假设 是 否 正当 是 人 类 推理 的 责任 而 不 是 自动 化 校 验 的 责任 。 当 
然 ， 集 成 和 验收 测试 可 以 提高 我 们 对 整个 系统 做 应 做 之 事 的 自信 。 




















ery 












































问 可 判定 的 问题 ， 在 必要 的 时 候 要 保守 一 些 。 上 面 的 建议 通过 实际 运行 一 个 程序 的 很 多 
部 分 来 看 发 生 了 什么 ， 它 总 是 会 引入 无 限 循环 的 风险 ， 但 有 的 问题 可 以 只 通过 静态 检查 
源 代码 就 能 回答 。 最 明显 的 例子 是 :“ 这 个 程序 含有 任何 的 语法 错误 吗 ?” 但 万 一 真正 
的 答案 是 不 可 判定 的 ， 我 们 也 准备 接受 近似 安全 的 话 ， 就 可 以 回答 更 有 意思 的 问题 。 


一 个 常规 分 析 就 是 浏览 程序 的 源 代码 看 它 是 否 含有 计算 出 来 的 值 从 来 不 用 的 死 代 码 
(dead code)， 或 者 含有 从 来 不 会 被 求 值 的 不 可 达 代 码 (unreachable code)。 我 们 不 可 能 
总 能 说 出 是 否 代码 是 真正 的 死 代 码 或 者 不 可 达 代 码 ， 因 此 只 能 保守 一 些 ,， 假 设 它 不 是 ， 
但 存在 明显 是 的 情况 : 在 某 些 语言 里 ， 我 们 知道 赋值 给 一 个 永远 不 再 使 用 的 局 部 变量 
肯定 是 死 的 ， 一 个 紧 跟 在 return 后 边 的 语句 必 是 不 可 达 的 。” 像 GCC 这 样 优化 的 编译 
器 就 是 使 用 这 个 技术 识别 和 去 除 不 必要 的 代码 ， 让 程序 更 小 更 快 而 且 不 会 影响 程序 的 
行为 。 


通过 把 程序 转换 成 更 简单 的 东西 来 近似 它 ， 然 后 问 关于 近似 的 可 判定 问题 。 这 个 重要 的 
思想 是 下 一 章 的 主题 。 












































E 21: Java 语言 规范 要 求 编译 器 拒绝 任何 含有 不 可 达 代 码 的 程序 。 参 见 http://docs.oracle.com/javase/specs/jls/ 
se7/html/ils-14.html#1s-14.21， 其 中 有 Java 编译 器 如 何不 运行 程序 就 判定 一 个 程序 哪 一 部 分 有 可 能 不 
可 达 的 元 长 解释 。 
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第 9 章 


在 “玩偶 国 中 编程 





编程 就 是 用 语法 与 机 器 交流 思想 。 在 写 程序 的 时 候 ， 我 们 知道 在 程序 执行 的 时 候 我 们 
想 要 机 器 做 什么 ， 而 了 解 编程 语言 的 语义 让 我 们 相信 机 器 将 理解 程序 每 个 细节 的 含义 。 


但 复杂 的 计算 机 程序 远 非 单个 语句 和 表达 式 的 累加 那么 简单 。 一 旦 把 许多 小 零件 组 合 到 一 
起 构成 更 大 的 整体 ， 能 检查 整个 程序 是 否 实际 做 了 我 们 想 要 它 做 的 事 会 很 有 用 。 例 如 ， 我 
们 可 能 想 要 知道 它 总 是 返回 确定 的 结果 ， 或 者 运行 这 个 程序 能 对 文件 系统 或 者 网 络 有 既定 
的 副作用 ， 或 者 只 是 不 含有 明显 的 一 遇见 非 期 望 输入 就 会 导致 明 溃 的 bug。 


实际 上 ， 我 们 可 能 想 要 程序 拥有 各 种 各 样 的 属性 ， 而 如 果 能 只 是 检查 一 个 特定 程序 的 语法 
来 看 它 是 否 有 那些 属性 ， 将 是 相当 方便 的 事情 。 但 从 Rice 定理 可 知 ， 通 过 看 源 代码 预测 一 
个 程序 的 行为 不 可 能 总 是 给 出 正确 答案 。 当 然 ， 最 直接 的 查 明 一 个 程序 将 会 做 什么 的 途径 
就 是 执行 它 ， 有 时 候 这 确实 没 问 题 一 一 大 量 的 软件 测试 就 是 通过 基于 已 知 的 输入 运行 再 根 
据 期 望 的 输出 检查 结果 完成 的 一 一 但 有 时 候 运 行 代码 可 能 也 不 是 一 种 可 接受 的 方式 ， 原 因 
如 下 。 


首先 ， 任 何 有 用 的 程序 有 可 能 会 处 理 直 到 运行 时 才 知 道 的 一 些 信 息 : 来 自用 户 的 交互 式 
输入 ， 作 为 参数 传 进 来 的 文件 ， 从 网 络 读 取 的 数据 ， 诸 如 此 类 的 东西 。 我 们 当然 可 以 用 
一 些 假 的 输入 运行 程序 以 便 感知 它 能 做 什么 ， 但 那 只 会 告诉 我 们 针对 这 些 输入 的 程序 行 
为 ， 而 真正 的 输入 不 一 样 时 会 发 生 什么 呢 ?” 用 输入 的 所 有 组 合 运行 程序 经 常 是 不 实际 或 
者 不 可 能 的 ， 而 用 特定 集合 的 输入 运行 程序 虽然 可 行 ， 却 不 一 定 能 告诉 我 们 有 关 其 行为 
的 多 少 信息 。 















































还 有 一 个 问题 ， 我 们 在 8.1.4 市 已 经 探索 过 了 ， 就 是 用 足够 强大 “的 语言 写成 的 程序 可 以 永 


265 


远 运 行 而 从 来 不 会 产生 结果 。 这 让 通过 运行 程序 来 可 靠 地 研究 任意 程序 变 得 不 可 能 ， 因 为 
有 时候 不 可 能 预先 说 出 一 个 程序 是 否 会 无 限 运行 (参见 8.3 节 )， 因 此 任何 尝试 运行 程序 的 
自动 监测 器 都 面临 永远 得 不 到 答案 的 风险 。 


最 后 ， 即 使 一 个 程序 不 管 什 么 原因 ， 它 事先 所 有 的 输入 数据 都 可 用 ， 而 且 总 是 能 终止 而 不 
会 永远 循环 ， 运 行 这 个 程序 的 代价 也 可 能 非常 高 或 者 很 不 方便 。 可 能 会 花 很 长 时 间 才 会 结 
束 ,， 或 者 有 不 可 逆转 的 副作用 一 一 发 送 邮 件 、 汇 钱 、 发 射 导弹 一 一 对 于 测试 的 目的 ， 这 些 
都 是 不 应 该 发 生 的 。 








所 有 这 些 原因 让 能 够 不 实际 执行 程序 就 能 发 现 它 的 问题 变 得 很 有 用 。 做 到 这 一 点 的 一 种 方 
式 是 使 用 抽象 解释 ， 这 是 一 种 分 析 技 术 。 使 用 这 种 技术 时 ， 我 们 执行 这 个 程序 的 简化 版 
本 ， 然 后 使 用 执行 结果 推导 出 原始 程序 的 性 质 来 。 


9.1 抽象 解释 


抽象 解释 给 了 我 们 一 种 着 手 处 理 难处 理 问 题 的 方法 ， 这 些 难 处 理 的 问题 或 许 过 于 庞大 ， 过 
于 复杂 ， 或 者 有 太 多 的 未 知 东西 难以 直接 处 理 。 抽 象 解释 的 主要 思想 就 是 使 用 抽象 ， 或 者 
通过 让 它 更 小 ， 更 简单 ， 或 者 通过 去 掉 未 知 的 东西 ， 但 这 样 做 还 能 保留 足够 的 细节 ， 以 便 
让 它 的 解决 方案 与 原始 问题 相关 。 


为 了 让 这 个 模糊 的 想法 更 具体 ， 让 我 们 看 一 个 抽象 解释 的 简单 应 用 。 


9.1.1 ”路线 规划 
假设 你 是 一 个 身 处 陌生 国家 的 旅行 者 ， 想 要 做 到 另 一 个 镇 的 公路 旅行 计划 。 你 怎么 决定 要 
走 哪 条 路 线 呢 ? 一 个 直接 的 解决 方案 就 是 跳 上 你 租 来 的 汽车 ， 然 后 朝 看 起 来 最 有 希望 到 达 
目的 地 的 方向 行驶 。 取 决 于 你 的 幸运 程度 和 外 国 路 标 对 你 的 帮助 程度 ， 这 种 对 未 知道 路 的 
暴力 探索 可 能 最 终 让 你 到 达 目 的 地 。 但 这 是 一 个 昂贵 的 策略 ， 而 且 很 可 能 在 完全 放弃 之 
前 ， 你 会 越 来 越 迷路 。 
































使 用 地 图 来 规划 你 的 旅行 是 极 理性 的 想法 。 印 在 纸 上 的 公路 地 图 是 牺牲 现实 公路 网 络 大 量 
细节 之 后 的 一 个 抽象 。 它 不 会 告诉 你 交通 是 什么 样 ， 哪 条 公路 当前 关闭 了 ， 某 个 建筑 物 在 
哪儿 ， 或 者 关于 第 三 维 的 任何 东西 。 至 关 重 要 的 是 ， 它 比 真实 的 东西 更 小 更 平 。 但 一 张 地 
图 确实 保留 了 旅行 规划 所 需要 的 最 重要 的 信息 : 所 有 镇 的 相对 位 置 ， 哪 条 路 通 向 哪个 镇 ， 
以 及 哪些 路 彼此 之 间 如 何 连接 。 











尽管 丢掉 了 一 些 细 市 ， 但 一 个 准确 的 地 图 仍然 是 有 用 的 ， 因 为 它 指定 的 路 线 很 可 能 在 现实 











注 1:“ 足 够 强大 ”这 里 意思 是 “通用 的 "， 参 见 8.1.4 市 。 
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中 是 有 效 的 。 地 图 制作 人 员 已 经 完成 了 创建 现实 模型 的 昂贵 工作 ， 这 让 你 能 只 查看 简化 的 
公路 网 络 并 规划 路 线 。 然 后 当 你 驾车 驶 向 目的 地 时 ， 你 可 以 把 计算 的 结果 转换 回 现实 世界 
中 。 按 照 地 图 这 个 抽象 世界 指定 的 路 线 ， 可 以 避免 试 错 的 昂贵 代价 。 








近似 的 地 图 让 行驶 计算 更 容易 ， 又 不 会 损失 结果 的 准确 性 。 在 很 多 情况 下 ， 用 地 图 做 决策 
可 能 会 是 错 的 一 一 无 法 保证 地 图 告诉 你 旅行 需要 的 所 有 信息 一 一 但 预先 规划 路 线 可 以 让 你 
排除 一 些 错 误 ， 让 从 一 个 地 方 到 另 一 个 地 方 容 易 控 制 得 多 。 


9.1.2 抽象 : 乘法 的 符号 
用 印刷 地 图 规划 路 线 是 抽象 解释 的 现实 应 用 ， 也 非常 随意 。 如 果 要 举 一 个 更 正式 的 例子 ， 
我 们 可 以 看 一 下 数字 的 乘法 。 尽 管 这 仍然 是 个 小 例子 ， 但 乘法 让 我 们 有 机 会 开始 写 代 码 研 


究 这 些 思想 。 





























假设 两 个 数 相 乘 是 一 个 困难 或 者 昂贵 的 运算 ， 而 我 们 对 不 实际 执行 乘法 就 查 明 它 结果 的 某 些 
信息 很 感 兴趣 。 特 别 地 : 结果 的 符号 是 什么 ? 它 是 一 个 负数 、 零 ， 还 是 一 个 整数 呢 ? 


理论 上 的 难点 是 在 具体 的 世界 中 进行 计算 ， 使 用 乘法 的 标准 解释 : 真 的 把 数字 乘 起 来 ， 看 
结果 的 数 ， 然 后 决定 结果 是 否 为 负 的 ， 零 ， 或 者 是 正 的。 例如 ， 在 Ruby 中 























>>6+* -9 
=> -54 


-54 是 负数 ， 所 以 我 们 知道 了 6 和 -9 的 乘积 是 一 个 负数 。 任 务 完成 了 。 


尽管 如 此 ， 通 过 在 抽象 世界 中 进行 计算 ， 使 用 乘法 的 抽象 解释 ， 也 可 能 发 现 同样 的 信息 。 
就 像 一 个 地 图 使 用 平面 纸 上 的 线 来 表示 现实 世界 中 的 道路 一 样 ， 我 们 使 用 抽象 的 值 来 表示 
数字 ;， 我们 可 以 在 地 图 上 设计 一 条 路 线 ， 而 不 必 在 真实 道路 上 通过 试 错 来 找到 路 。 可 以 在 
抽象 值 上 定义 一 个 抽象 的 乘法 运算 ， 而 不 必 使 用 具体 数 之 上 的 具体 乘法 。 


为 此 ， 我 们 需要 设计 抽象 的 值 让 计算 在 结果 仍 为 有 用 答案 的 同时 ， 变 得 更 简单 。 可 以 利用 
两 个 乘 数 的 绝对 值 :不 影响 结果 符号 的 事实 : 


>> (6 * -9) 《0 

= true 

>> (1000 * -5)《 0 
=> true 

>> (1 * -1) 《0 

=> true 


小 时 候 ， 我 们 就 知道 关键 要 看 乘 数 的 符号 : 两 个 正 数 的 乘积 ， 或 者 两 个 负数 的 乘积 ， 总 是 一 
个 正 数 ， 一 个 正 数 和 一 个 负数 的 乘积 总 是 负数 ， 而 零 与 任何 数 的 乘积 都 是 零 。 




















注 2: 一 个 数 的 绝对 值 是 把 符号 去 掉 时 候 的 值 。 例 如 ，-10 的 绝对 值 是 10。 
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因此 使 用 “负数 "、“ 零 ”和 “ 正 数 ” 作 为 抽象 值 ， 可 以 用 Ruby 定义 一 个 Sign 类 然后 创建 
它 的 三 个 实例 : 


class Sign < Struct.new(:name) 
NEGATIVE, ZERO, POSITIVE = [:negative, :zero, :positive].map { |name| new(name) } 


def inspect 
"#<Sign #{name}>" 
end 
end 


这 给 了 我 们 可 以 用 作 抽 象 值 的 Ruby 对 象 : Sign: :NEGATIVE 代表 “任何 负数 ”，Sign: :ZERO 
代表 “数字 零 ”， 而 Sign: :POSITIVE 代表 “任意 正 数 ”"。 这 三 个 Sign 对 象 组 成 了 这 个 小 的 
抽象 世界 ， 在 这 个 世界 里 ， 我 们 将 执行 抽象 运算 。 而 与 此 同时 ， 有 具体 的 世界 里 包含 着 事实 
上 无 限 个 Ruby 的 正 数 。” 


我 们 可 以 通过 实现 符号 相关 的 乘法 来 定义 Sign 值 的 抽象 乘法 : 


class Sign 
def *(other sign) 
if [self, other sign].include?(ZERO) 
ZERO 
elsif self == other sign 
POSITIVE 
else 
NEGATIVE 
end 
end 
end 


sign 的 实例 现在 可 以 像 数 字 那 样 “ 乘 ”到 一 起 了 ， 并 且 Sign#* 的 实现 产生 的 答案 与 实际 
数字 乘法 的 一 致 








>> Sign: :POSITIVE * 9ign: :POSITIVE 
=> #<Sign positive> 

>> Sign::NEGATIVE * Sign::ZERO 

=> #<Sign zero> 

>> Sign::POSITIVE * Sign::NEGATIVE 
=> #<Sign negative> 


例如 ， 上 面 的 最 后 一 行 癌 的 问题 是 : 我 们 把 任意 的 正 数 乘 以 任意 的 负数 得 到 的 结果 是 什 
么 ? 答案 是 : 一 个 负数 。 这 仍然 是 一 种 乘法 ， 但 比 我 们 习惯 的 那 种 要 简单 ， 它 只 对 几乎 已 
经 去 掉 所 有 识别 信息 的 “数字 ”起 作用 。 如 果 把 真实 的 乘法 想象 成 是 昂贵 的 ， 那 这 个 缩减 
的 乘法 版 本 就 是 廉价 的 。 




















注 3: Ruby 的 Bignum 对 象 可 以 表示 任意 大 小 的 正 数 ， 它 只 受 可 用 内 存 的 限制 。 











A 
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有 了 数字 的 抽象 世界 和 对 这 些 数 字 乘 法 的 抽象 解释 之 后 ， 我 们 可 以 用 不 同 的 方式 处 理 最 初 
的 问题 了 。 我 们 不 是 把 两 个 数字 直接 相 乘 来 找到 它们 结果 的 符号 ， 而 是 把 数字 转换 成 它们 
的 抽象 表示 再 把 它们 相 乘 。 首 先 ， 需 要 一 种 把 具体 数 转换 成 抽象 数 的 方法 : 


class Numeric 
def sign 
if self < 0 
Sign: :NEGATIVE 
elsif zero? 
Sign: :ZERO 
else 
Sign: :POSITIVE 
end 
end 
end 


现在 ， 可 以 转换 两 个 数 然后 在 抽象 世界 中 做 乘法 了 : 





>> 6.sign 
=> #<Sign positive> 
>> -9.sign 
=> #<Sign negative> 
>> 6.sign * -9.sign 
=> #<Sign negative> 


我 们 又 计算 出 了 6 * -9 会 得 到 一 个 负数 ， 但 这 次 没 进行 任何 实际 数字 的 乘法 。 步 入 抽象 世 
界 让 我 们 有 了 执行 计算 的 另 一 种 方式 ， 更 重要 的 是 ， 这 个 抽象 结果 能 转换 回 具体 的 世界 ， 
这 样 就 能 搞 清 它 的 意思 ， 尽 管 抽象 时 牺牲 细节 只 得 到 了 一 个 近似 的 答案 。 在 这 个 场景 下 ， 
抽象 结果 Sign: :NEGATIVE 表明 任何 具体 的 数 -1、-2、-3 等 都 可 能 是 6 * -9 的 答案 ,但 答 
案 肯 定 不 是 0 或 者 任何 像 1 或 500 这 样 的 正 数 。 


注意 ， 因 为 Ruby 的 值 都 是 对 象 〈( 带 有 操作 的 数据 结构 ) ， 所 以 可 以 根据 提供 的 是 具体 的 
(Fixnum) 还 是 抽象 的 (Sign) 对 象 ， 我 们 可 以 使 用 同样 的 Ruby 表达 式 为 参数 执行 具体 或 
抽象 的 计算 。 用 #calculate 方法 把 三 个 数 用 特别 的 方式 乘 起 来 ; 


























def calculate(x, y, z) 
(x * y) * (x * z) 
end 


如 果 使 用 Fixnum 对 象 调用 #calculate， 这 个 计算 将 由 Fixnum#* 完成 ， 从 而 得 到 一 个 具体 的 


Fixnum 结果 。 相 反 ， 如 果 我 们 用 Sign 对 象 调用 它 ，Sign#* 操作 将 会 调用 并 生成 一 个 sign 
结果 。 


>> calculate(3，-5，0) 

=> 0 

>> calculate(Sign: :POSITIVE，Sign: :NEGATIVE，Sign: ;ZERO) 
=> #<Sign zero> 
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这 给 了 我 们 在 真正 的 Ruby 程序 中 执行 抽象 解释 的 有 限 机 会 ， 可 以 把 具体 的 参数 替换 成 它 
们 对 应 的 抽象 相对 物 ， 然 后 无 需 修 改 就 可 以 运行 其 他 代码 了 。 











这 个 技术 让 人 联想 到 自动 化 单元 测试 中 打桩 测试 〈test doubles) 的 方法 (如 

心 存根 和 模拟 对 象 )。 桩 是 插 到 代码 中 的 一 个 特别 的 占 位 对 象 ， 使 用 这 种 方法 

侍 ， 可 以 控制 和 校 验 代码 的 行为 。 在 使 用 更 现实 的 对 象 作为 测试 数据 特别 不 方便 
或 者 特别 昂贵 的 条 件 下 ， 它 们 特别 有 用 。 











9.1.3 ”安全 和 近似 : 增加 符号 

目前 为 止 可 以 看 到 ， 抽 象 世 界 中 的 计算 比 具体 世界 中 的 对 应 计算 在 准确 性 上 要 差 一 些 ， 因 
为 抽象 会 丢掉 细节 : 在 地 图 上 规划 的 路 线 会 表明 在 哪 条 路 转变， 但 不 会 说 在 哪 条 车 道行 
驶 ， 两 个 Sign 对 象 的 乘法 会 表明 结果 在 零 的 哪 一 边 ， 但 不 会 告知 实际 结果 值 。 


很 多 时 候 ， 结 果 不 准确 是 没 问 题 的， 但 对 一 个 需要 有 用 的 抽象 ， 很 重要 的 是 这 个 不 准确 是 
安全 的 。 安 全 意味 着 这 个 抽象 总 是 能 给 出 真相 : 抽象 计算 的 结果 一 定 要 与 它 对 应 的 具体 结 
果 一 致 。 如 果 不 一 致 ， 抽 象 给 我 们 的 信息 就 不 可 靠 ， 这 可 能 比 无 用 还 要 差 。 

Sign 抽象 是 安全 的 ， 因 为 把 数字 转换 成 Sign， 并 把 它们 乘 在 一 起 所 给 出 的 结果 总 是 与 计算 
数字 本 身 然后 把 最 终结 果 转 成 Sign 一 样 : 











>> (6 * -9).sign == (6.sign * -9.sign) 


=> true 

>> (100 * 0).sign == (100.sign * 0.sign) 

=> true 

>> calculate(1, -2, -3).sign == calculate(1.sign, -2.sign, -3.sign) 
=> true 

















在 这 方面 ，Sign 抽象 实际 上 是 非常 准确 的 。 它 准确 保留 了 合适 数量 的 信息 并 通过 抽象 计算 
把 它们 完美 保留 下 来 。 在 抽象 与 想 要 执行 的 计算 不 是 那么 匹配 的 时 候 ， 安 全 性 问题 变 得 更 
重要 了 ， 通 过 抽象 加 法 实验 我 们 将 看 到 这 一 点 。 


两 个 数 的 符号 如 何 确定 它们 加 到 一 起 得 到 的 数字 的 符号 ， 有 一 些 规则 ， 但 它们 并 不 是 
对 所 有 可 能 的 符号 组 合 都 有 作用 。 我 们 知道 两 个 正 数 的 和 一 定 是 正 数 ， 而 一 个 负数 和 
零 的 和 一 定 是 负数 ， 但 如 果 把 一 个 负数 和 一 个 正 数 加 到 一 起 会 怎么 样 呢 ? 在 这 种 情况 
下 ， 结 果 的 符号 取决 于 两 个 数 绝对 值 的 关系 : 如 果 正 数 的 绝对 值 比 负 数 的 绝对 值 大 ， 
我 们 得 到 的 答案 就 是 正 的 〈-20+30=10) ， 如 果 负 数 的 绝对 值 更 大 ， 那 就 会 得 到 负数 的 
答案 (-30+20=-10) ， 而 如 果 它 们 的 绝对 值 恰 好 相等 ， 会 得 到 零 。 但 当然 ， 每 个 数 
的 绝对 值 正好 是 我 们 的 抽象 已 经 丢弃 的 信息 ， 因 此 不 可 能 在 抽象 世界 中 做 出 这 种 符号 
的 判定 。 























对 我 们 的 抽象 这 是 一 个 问题 ， 因 为 它 太 抽象 了 ， 不 能 在 每 种 情况 下 都 准确 地 进行 计算 。 如 
何 处 理 这 种 情况 呢 ? 我 们 可 以 添加 抽象 加 法 的 定义 让 它 返 回 同样 的 结果 一 一 比如 说 只 要 不 
知道 正确 答案 的 时 候 就 返回 Sign: :ZER0 一 一 但 那 会 不 安全 ， 因 为 那 意味 着 抽象 计算 给 出 的 
答案 可 能 与 通过 具体 计算 得 到 的 答案 不 一 致 。 






































解决 方案 就 是 扩展 抽象 以 适应 这 个 不 确定 性 。 就 像 Sign 值 意思 是 “任何 正 数 ” 和 “任何 负 
数 ” 一 样 ， 我 们 可 以 引入 一 个 新 的 ， 它 只 表示 “任何 数 "。 这 实际 上 是 最 实在 的 答案 ,在 
遇 到 问题 但 没有 足够 细 市 的 时 候 我 们 可 以 给 出 这 个 答案 来 : 结果 可 能 是 负数 、 零 ， 或 者 正 
数 ， 不 保证 到 底 是 哪 种 。 让 我 们 管 这 个 新 值 叫 作 Sign: :UNKNOWN: 




















class Sign 
UNKNOWN = new(:unknown) 
end 


这 给 了 我 们 安全 实现 抽象 加 法 所 需要 的 东西 。 计 算 两 个 数 x 和 y 之 和 的 符号 的 规则 是 : 








。 如 果 x 和 Yy 符号 相同 〈 同 为 正 、 同 为 负 ， 或 者 都 是 零 )， 那 这 个 符号 就 是 它们 和 的 符号 ; 
。 如 果 x 是 零 ， 它 们 的 和 与 y 的 符号 相同 ， 反 过 来 也 是 这 样 ， 
。 否则 ， 它 们 和 的 符号 未 知 。 


很 容易 把 这 些 规则 转换 成 Sign#+: 





class Sign 
def +(other sign) 
if self == other sign || other sign == ZERO 
self 
elsif self == ZERO 
other_ sign 
else 
UNKNOWN 
end 
end 
end 


这 样 给 出 的 行为 正 是 我 们 想 要 的 : 


>> Sign::POSITIVE + Sign::POSITIVE 
=> #<Sign positive> 

>> Sign::NEGATIVE + Sign::ZERO 

=> #<Sign negative> 

>> Sign::NEGATIVE + Sign::POSITIVE 
=> #<Sign unknown> 








事实 上 ,在 输入 中 有 一 个 符号 未 知 的 时 候 这 个 实现 恰好 做 了 正确 的 事 : 


el 
tt 


>> Sign::POSITIVE + Sign::UNKNOWN 
=> #<Sign unknown> 
>> Sign::UNKNOWN + Sign::ZERO 
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=> #<Sign unknown> 
>> Sign::POSITIVE + Sign::NEGATIVE + Sign::NEGATIVE 
=> #<Sign unknown> 


但 是 我 们 确实 需要 回去 修改 Sign 林 的 实现 ， 以 便 它 能 正确 地 处 理 Sign: :UNKNOWN 





class Sign 
def *(other sign) 
if [self, other sign].include?(ZERO) 
ZERO 
elsif [self, other sign].include?(UNKNOWN) 
UNKNOWN 
elsif self == other sign 
POSITIVE 
else 
NEGATIVE 
end 
end 
end 


这 样 我 们 就 有 了 两 个 可 以 使 用 的 抽象 操作 。 注 意 ，Sign: :UNKNOWN 是 不 传染 的 ， 即 使 一 个 
未 知 数 乘 以 零 也 仍然 是 零 ， 因 此 任何 中 间 存 在 的 不 确定 性 都 可 能 在 结束 时 被 消化 掉 : 





>> (Sign::POSITIVE + Sign::NEGATIVE) * Sign::ZERO + Sign::POSITIVE 
=> #<Sign positive> 

















为 了 处 理 Sign: :UNKNOWN 引入 的 不 准确 性 ， 我 们 还 需要 调整 对 正确 性 的 认识 。 因 为 抽象 有 
时 候 没 有 足够 的 信息 给 出 准确 答案 ,一 个 计算 的 抽象 和 具体 版 本 也 不 总 是 能 给 出 互相 准确 
匹配 的 结果 了 : 

















>> (10 + 3).sign == (10.sign + 3.sign) 


=> true 
>> (-5 + 0).sign == (-5.sign + 0.sign) 
=> true 
>> (6 + -9).sign == (6.sign + -9.sign) 
=> false 


>> (6 + -9).sign 

=> #<Sign negative> 
>> 6.sign + -9.sign 
=> #<Sign unknown> 





怎么 回 事 呢 ? 抽象 还 安全 吗 ? 是 的 ， 因 为 在 失去 准确 度 返 回 Sign: :UNKNOWN 的 时 候 ， 抽 象 
计算 告诉 我 们 的 仍然 是 某 种 事实 :“ 结 果 是 一 个 负数 、 零 ， 或 者 正 数 。 它 没有 执行 具体 计 
算 所 得 到 的 结果 有 用 ， 但 它 没 错 ， 并 且 它 好 在 没有 往 抽 象 值 中 添加 更 多 信息 从 而 让 抽象 计 
算 变 复杂 。 

我 们 在 代码 中 可 以 用 一 种 比 #= 更 好 的 方式 来 比较 符号 ，#== 现在 太 不 利于 安全 检查 了 。 
这 里 想 要 知道 的 是 : 具体 计算 的 结果 在 抽象 计算 所 预测 的 结果 范围 内 吗 ? 如 有 果 抽象 计算 声 
称 可 能 有 几 个 不 同 的 结果 ， 那 具体 计算 是 实际 产生 了 这 个 结果 中 的 一 个 ， 还 是 完全 是 另外 
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的 结果 呢 ? 


在 Sign 上 定义 一 个 操作 ， 它 可 以 告诉 我 们 两 个 抽象 值 是 否 用 这 种 方式 彼此 关联 。 既 然 我 们 
在 测试 一 个 Sign 的 值 是 否 “ 落 在 ” 男 一 个 里 ， 那 么 叫 它 权 = 方法 吧 : 





class Sign 
def <=(other sign) 
self == other sign || other sign == UNKNOWN 
end 
end 


这 样 我 们 就 可 以 做 测试 了 : 


>> Sign::POSITIVE <= Sign::POSITIVE 
=> true 
>> Sign::POSITIVE <= Sign: :UNKNOWN 
=> true 
>> Sign::POSITIVE <= Sign::NEGATIVE 
=> false 


现在 可 以 检查 安全 性 了 ， 看 一 下 是 否 每 个 具体 计算 的 结果 都 落 在 了 抽象 计算 预测 的 范 
围 里 : 











>> (6 * -9).sign <= (6.sign * -9.sign) 


=> true 
>> (-5 + 0).sign <= (-5.sign + 0.sign) 
=> true 
>> (6 + -9).sign <= (6.sign + -9.sign) 
=> true 


安全 性 对 包括 加 法 和 乘法 在 内 的 任何 计算 都 能 保持 ， 因 为 当 抽 象 计 算 无 法 给 出 准确 答案 的 
时 候 ， 我 们 已 经 设计 了 一 个 能 进行 安全 近似 的 抽象 。 





顺便 说 一 下 ， 能 访问 这 个 抽象 让 我 们 能 对 进行 数 的 加 和 乘 的 Ruby 代码 做 简单 的 分 析 。 作 
为 一 个 实例 ， 下 面 是 一 个 计算 平方 和 的 方法 : 
def sum of squares(x，y) 


(x * x) + (y * y) 
end 

















如 果 想 要 自动 分 析 这 个 方法 以 了 解 它 的 某 些 行为 ， 我 们 可 以 把 它 处 理 成 黑 盒 ， 用 所 有 可 
能 的 参数 运行 它 ， 这 可 能 会 造成 永久 运行 ， 也 可 以 检查 它 的 源 代 码 并 尝试 使 用 数学 推理 
来 推导 出 它 的 属性 ， 这 样 很 复杂 。( 而 在 一 般 情况 下 ， 由 于 Rice 定理 这 注定 失败 。) 抽象 
解释 给 了 我 们 第 三 个 选项 ， 可 以 用 抽象 值 调用 这 个 方法 ， 看 这 个 计算 的 抽象 版 本 会 产生 
什么 输出 ， 因 为 抽象 值 的 组 合 数 只 是 一 个 很 小 的 数字 ， 所 以 为 所 有 的 可 能 输入 这 么 做 也 


是 可 行 的 。 


每 个 参数 x 和 y 都 可 能 是 负数 、 零 或 者 正 数 ， 因 此 让 我 们 看 看 输出 都 有 哪些 可 能 : 
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>> inputs = Sign::NEGATIVE, Sign::ZERO, Sign::POSITIVE 
=> [#<Sign negative>, #<Sign zero>, #<Sign positive>] 
>> outputs = inputs.product(inputs).map { |x, y| sum of squares(x, y) } 
=> [ 

#<Sign positive>, #<Sign positive>, #<Sign positive>, 

#<Sign positive>, #<Sign zero>, #<Sign positive>， 

#<Sign positive>, #<Sign positive>, #<Sign positive> 

] 

>> outputs .uniq 
=> [#<Sign positive>, #<Sign zero>] 


不 必 经 过 任何 智能 分 析 ， 这 就 能 告诉 我 们 #sum_of_squares 只 能 产生 零 或 者 正 数 ， 从 来 不 
会 有 负数 一 一 对 于 读 过 代码 的 人 来 说 ， 这 是 一 个 相当 无 聊 的 特性 ， 但 对 机 器 来 说 ， 这 都 无 
所 谓 。 当 然 ， 这 种 小 技巧 只 对 非常 简单 的 代码 起 作用 ， 但 尽管 是 个 小 玩具 ， 它 还 是 展示 了 
抽象 如 何 能 让 一 个 难题 变 得 更 容易 处 理 。 


9.2 静态 语义 


到 目前 为 止 ， 我 们 已 经 看 到 了 如 何不 实际 执行 计算 就 能 发 现 它 的 近似 信息 。 我 们 本 可 以 通 
过 实际 执行 计算 来 获得 更 多 信息 ， 但 近似 的 信息 比 没 有 还 是 要 强 ， 而 且 对 于 某 些 程序 (如 
路 线 规划 ) ， 可 能 这 就 是 我 们 所 需要 的 全 部 了 。 


在 乘法 和 加 法 的 例子 里 ， 我 们 通过 把 输入 的 有 具体 数 换 成 抽象 值 ， 把 一 个 小 程序 转 成 了 一 个 
更 简单 更 抽象 的 版 本 ， 但 如 果 想 要 研究 更 大 更 复杂 的 程序 ， 用 这 种 技术 只 能 到 这 个 程度 了 。 
提供 给 它们 自己 乘法 和 加 法 实现 的 值 很 容易 创建 ， 但 更 一 般 的 情况 下 ，Ruby 并 不 允许 值 控 
制 它 们 自身 的 行为 (例如 在 if 语句 中 使 用 它们 的 时 候 )， 因 为 它 对 特定 的 语法 片段 如 何 工 
作 有 硬 编码 的 规则 “。 除 此 之 外 ,仍然 存 在 的 问题 是 ， 因 为 一 些 程序 会 永远 循环 而 不 会 返回 
结果 ， 所 以 通常 情况 下 通过 运行 程序 并 等 待 其 输出 来 了 解 程序 并 不 可 行 。 

乘法 和 加 法 的 例子 还 有 另 一 个 缺点 ， 那 就 是 它们 没什么 意思 ， 设 有 人 会 关注 它们 的 程序 返 
回 正 数 或 者 负数 。 在 实践 中 ， 有 意思 的 是 像 “ 我 的 程序 运行 时 会 崩溃 吗 ?” 和 “我 的 程序 
能 变 得 更 有 效率 吗 ? ”这 类 问题 。 


























我 们 可 以 通过 思考 它们 的 静态 语义 来 回答 关于 程序 的 更 有 趣 的 问题 。 在 第 2 章 ， 我 们 了 解 
了 编程 语言 的 动态 语义 ， 一 种 定义 代码 运行 时 含义 的 方法 。 一 种 语言 的 静态 语义 告诉 我 们 
程序 性 质 ， 无 需 执行 就 可 以 研究 。 静 态 语 义 的 经 典 例子 就 是 类 型 系统 它 是 一 个 能 用 来 分 
析 程 序 的 规则 集合 ， 能 检查 其 中 是 否 含有 某 种 bug。 在 2.3.1 市 的 “正确 性 ”里 ， 我 们 考 
虑 的 是 像 «x=true; x=x+1» 这 样 的 Simple 程序 ， 它 在 语法 上 有 效 但 执行 时 会 引起 动态 语 
义 的 问题 。 一 个 类 型 系统 可 以 事先 预 判 这 些 错 误 ， 在 一 些 坏 程序 被 人 尝试 执行 之 前 就 自动 
拒绝 它 。 











注 4: 和 SmallTalk 不 同 。 
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抽象 解释 给 了 我 们 思考 程序 静态 语义 的 方式 。 程 序 注 定 要 执行 ， 因 此 一 个 程序 含义 的 标准 
解释 就 是 由 它 的 动态 语义 给 出 的 : “x=1+2; y=x*3» 这 个 程序 通过 进行 算术 运算 并 把 它们 存 
储 在 内 存 的 某 个 地 方 来 操纵 数字 。 但 如 果 有 另 一 个 这 种 语言 的 更 抽象 语义 ， 我 们 可 以 根据 
不 同 的 规则 “执行 ”同样 的 程序 ， 并 得 到 更 抽象 的 结果 ， 这 个 结果 可 以 提供 关于 程序 在 正 
常 解释 时 所 发 生 事情 的 一 部 分 信息 。 





























9.2.1 实现 

通过 为 第 2 章 的 Simple 语言 构建 一 个 类 型 系统 ， 我 们 可 以 把 这 个 思想 具体 化 。 表 面 上 ， 这 
看 起 来 很 像 2.3.2 节 中 的 大 步 操作 语义 : 将 为 每 个 表示 Simple 程序 (Numper、Add 等 ) 的 语 
法 类 实现 一 个 方法 ， 而 且 调 用 这 个 方法 将 会 返回 一 个 最 终结 果 。 在 动态 语义 中 ， 这 个 方法 
叫 #evaluate， 而 且 它 的 结果 要 么 是 完全 求 过 值 的 Simple 值 ， 要 么 是 一 个 把 名 字 和 Simple 
值 关 联 起 来 的 环境 ， 这 取决 于 是 在 对 表达 式 求 值 还 是 在 对 语句 求 值 : 








>> expression = Add.new(Variable.new(:x), Number.new(1)) 
=> «xX + 1» 


>> expression.evaluate({ x: Number.new(2) }) 
=> «3» 

>> statement = Assign.new(:y, Number.new(3)) 
=> «y = 3» 


>> statement.evaluate({ x: Number.new(1) }) 
=> «:X=>«1», :y=>«3»} 


对 于 静态 语义 ， 我 们 将 实现 不 同 的 方法 ， 它 做 的 工作 更 少 而 且 会 返回 更 抽象 的 结果 。 这 里 
的 抽象 值 不 是 具体 的 值 和 环境 ， 而 是 类 型 。 一 个 类 型 代表 许多 可 能 的 值 : 一 个 Simple 表 
达 式 可 以 求 值 成 一 个 数 或 者 一 个 布尔 值 ， 因 此 对 于 表达 式 ， 我 们 的 类 型 将 是 “任何 数 ” 和 
“任何 布尔 值 ”。 这 些 类 型 与 之 前 看 到 的 Sign 值 类 似 ， 特 别 是 像 实际 上 含义 是 “任何 数 ” 的 
Sign: :UNKNOWN。 就 像 sign 那样 ， 可 以 通过 定义 一 个 叫 Type 的 类 并 创建 一 些 实例 来 引入 
类 型 : 











class Type < Struct.new(:name) 
NUMBER, BOOLEAN = [:number, :boolean].map { |name| new(name) } 


def inspect 
"#<Type #{name}>" 
end 
end 





新 方法 将 会 返回 类 型 ， 因 此 我 们 叫 它 批 ype。 它 应 该 回答 一 个 问题 ,这 个 Simple 语法 求 值 
的 时 候 ， 它 将 返回 哪 种 类 型 的 值 呢 ? 这 对 Simple 的 Number 和 Boolean 语法 类 很 容易 实现 ， 
因为 数字 和 布尔 值 求 值 之 后 为 自身 ， 因 此 我 们 能 准确 地 知道 将 得 到 的 值 的 类 型 : 




















class Number 
def type 
Type: :NUMBER 
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end 
end 


class Boolean 
def type 
Type: :BOOLEAN 
end 
end 


对 于 像 Add、Multiply 和 LessThan 这 样 的 操作 ， 就 要 复杂 一 点 了 。 例 如 ， 我 们 知道 对 Add 
求 值 会 返回 一 个 数 ， 而 我 们 还 知道 只 有 Add 的 两 个 参数 都 求 值 为 一 个 数 时 它 才 能 求 值 成 








功 ， 不 然 Simple 解释 器 将 会 报错 : 


>> Add.new(Number.new(1), Number.new(2)).evaluate({}) 

=> «3» 

>> Add.new(Number.new(1), Boolean.new(true)).evaluate({}) 
TypeError: true can't be coerced into Fixnum 


怎么 弄 清 楚 一 个 参数 是 否 将 求 值 成 一 个 数 呢 ?” 那 是 它 的 类 型 告诉 我 们 的 。 





因此 对 于 Add， 


规则 类 似 这 样 : 如 果 两 个 参数 的 类 型 是 Type: :NUMBER， 那 最 终 的 结果 类 型 是 Type: :NUMBER; 























不 然 的 话 ， 结 果 没 有 类 型 ， 因 为 任何 试图 进行 非 数 字 加 法 的 表达 式 求 值 

















回 任何 结 


果 之 前 失败 。 为 了 简单 ， 我 们 将 让 其 ype 方法 返回 nil 以 表明 这 个 失败 ， 在 其 他 环境 下 ， 
如 果 能 让 最 终 的 实现 更 简单 ， 我 们 可 能 会 选择 抛 出 异常 或 者 返回 某 个 特别 的 错误 值 〈 例 如 


Type: :ERROR ) 。 
Add 的 代码 看 起 来 像 这 样 : 


class Add 
def type 
if left.type == Type::NUMBER && right.type == Type::NUMBER 
Type: :NUMBER 
end 
end 
end 


对 Multiply#type 的 实现 是 一 样 的 ，LessThan#type 也 非常 类 似 ， 只 是 它 会 


而 不 是 Type: :NUMBER : 


class LessThan 
def type 
if left.type == Type::NUMBER && right.type == Type::NUMBER 
Type: :BOOLEAN 
end 
end 
end 





I 





回 Type: :BOOLEAN 


在 控制 台 上 ， 我 们 可 以 看 到 这 足以 区 分 能 成 功 求 值 和 不 能 成 功 求 值 的 表达 式 ， 而 Simple 的 


语法 两 者 都 支持 : 





A 
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>> Add.new(Number .new(1)，Number.new(2)) .type 

=> #<Type number> 

>> Add.new(Number.new(1), Boolean.new(true)).type 

=> nil 

>> LessThan.new(Number.new(1), Number.new(2)).type 

=> #<Type boolean> 

>> LessThan.new(Number.new(1), Boolean.new(true)).type 
=> nil 





我 们 假设 抽象 语法 树 至 少 句 法 上 是 有 效 的 。 由 于 树叶 子 上 的 实际 值 被 静态 语 
一 义 包 略 了 ， 所 以 #type 可 能 会 错误 预测 一 个 坏 形 式 表达 式 的 求 值 行为 ， 

>> bad_expression = Add.new(Number.new(true) Number.new(1)) © 

=> «true + 1» 

>> bad_expression.type 

=> #<Type number> © 


>> bad_expression.evaluate({}) 
NoMethodError: undefined method “+' for true:TrueClass © 


@ 这 个 抽象 语法 树 的 高 层 结构 看 起 来 正确 〈 一 个 Add 含有 两 个 Number)， 但 
第 一 个 Number 对 象 是 畸形 的 ， 因 为 它 的 值 属性 是 true 而 不 是 Fixnum。 

名 静态 语义 假设 把 两 个 Number 加 在 一 起 总 是 产生 另 一 个 Number， 因 此 #type 
说 求 值 将 会 成 功 …… 

四 …… 但 如 果实 际 对 这 个 表达 式 求 值 ， 在 Ruby 尝试 往 true 上 加 1 的 时 候 我 
们 会 得 到 一 个 异常 。 



























































Simple 解析 器 应 该 永远 也 不 会 产生 坏 形式 的 表达 式 ， 因 此 这 在 实际 中 不 太 可 


能 是 问题 。 





这 是 之 前 加 法 、 乘 法 和 Sign 小 技巧 的 更 通用 的 版 本 。 即 使 没有 进行 任何 实际 的 加 法 或 者 数 
字 比 较 ， 静态 语义 给 了 我 们 “执行 ”程序 的 另 一 种 方式 ， 这 种 方式 仍 将 返回 有 用 的 结果 。 


我 们 没有 把 表达 式 “1+2» 解释 成 关于 值 的 程序 ， 而 是 扔 掉 一 些 细节 ， 把 它 解 释 成 关于 类 型 
的 一 个 程序 ， 而 静态 语义 提供 了 «1»、«2» 和 «+» 的 另 一 种 解释 ， 这 让 我 们 运行 这 个 关于 类 
型 的 程序 来 看 看 结果 是 什么 。 这 个 结果 没 那么 具体 ， 比 起 我 们 根据 动态 语义 正常 运行 程序 
所 得 到 的 更 抽象 ， 但 尽管 如 此 它 仍然 是 个 有 用 的 结果 ， 因 为 我 们 有 办 法 把 它 转 换 成 具体 世 
界 中 有 意义 的 一 些 东 西 : Type: :NUMBER 意味 着 “在 这 个 表达 式 上 调用 #evaluate 将 会 返回 
一 个 Number”， 而 nil 的 意思 是 “调用 #evaluate 可 能 会 引起 错误 ”。 



































我 们 现在 几乎 有 了 Simple 表达 式 的 完整 静态 语义 ， 但 还 没 看 变量 昵 。Variable#type 应 该 返 
回 什么 呢 ? 这 取决 于 变量 含有 什么 值 : 在 像 «x=5; y=x+1» 的 程序 里 ， 变 量 y 拥有 类 型 
Type: :NUMBER， 但 在 «x=5; y=x<1» 里 ， 它 的 类 型 是 Type: :BOOLEAN。 怎 么 处 理 这 种 情况 呢 ? 
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我 们 在 2.3.1 市 中 看 到 ，Variable 的 动态 语义 使 用 一 个 环境 散 列 把 变量 名 映射 到 它们 的 值 
上 ， 而 静态 语义 需要 某 种 类 似 的 东西 : 从 变量 名 到 类 型 的 映射 。 我 们 可 以 称 其 为 “类 型 环 
绕 "， 但 还 是 使 用 类 型 上 下 文 这 个 名 称 以 便 避 人 免 与 这 两 种 环境 混淆 。 如 果 把 一 个 类 型 上 下 
文 传 给 Variable#type， 它 需要 做 的 就 是 在 上 下 文中 查找 这 个 变量 : 








class Variable 
def type(context) 


























context[name] 
end 
end 
地 aa， 
、 这 个 类 型 上 下 文 来 自 哪 里 呢 ? 目前 ， 我 们 将 假设 它 能 通过 某 种 方式 得 到 ， 不 
心 。 管 什么 时 候 需 要 ， 都 能 通过 某 种 外 部 机 制 提供 。 例 如 ， 或 许 每 个 Simple 程序 











全 ”都 有 一 个 头 文件 来 声明 所 有 用 到 的 变量 ， 这 个 文件 在 程序 运行 的 时 候 没 有 作 
用 ， 而 只 是 用 来 在 开发 过 程 中 与 静态 语义 进行 自动 检查 。 

















现在 其 ype 期 望 一 个 上 下 文 参数 ， 我 们 需要 回 过 头 去 修改 出 其 ype 的 另 一 个 实现 以 接受 一 
个 类 型 上 下 文 : 


class NumberT 
def type(context) 
Type: :NUMBER 
end 
end 


class Boolean 
def type(context) 
Type: :BOOLEAN 
end 
end 


class Add 
def type(context) 
if left.type(context) == Type::NUMBER && right.type(context) == Type::NUMBER 
Type: :NUMBER 
end 
end 
end 


class LessThan 
def type(context) 
if left.type(context) == Type::NUMBER 8&& right.type(context) == Type::NUMBER 
Type: :BOOLEAN 
end 
end 
end 


Wa, 





这 提供 了 包含 变量 的 表达 式 类 型 ， 只 要 给 它们 提供 一 个 正确 类 型 的 上 下 文 即 可 : 





>> expression = Add.new(Variable.new(:x), Variable.new(:y)) 
=>(X 十 y» 

>> expression.type({}) 

=> nil 

>> expression.type({ x: Type::NUMBER, y: Type::NUMBER }) 

=> #<Type number> 

>> expression.type({ x: Type::NUMBER, y: Type::BOOLEAN }) 
=> nil 


这 给 了 我 们 各 种 表达 式 语法 的 批 ype 实现 ， 那 么 语句 呢 ?对 一 个 Simple 语句 求 值 会 返 
个 环境 ， 而 不 是 一 个 值 ， 那 么 在 静态 语义 中 如 何 表达 呢 ? 


处 理 语句 的 最 简单 方式 就 是 把 它们 看 成 是 一 种 无 效 的 表达 式 : 假设 它们 不 返回 值 ( 这 是 真 
的 ) 并 且 忽 略 它 们 对 环境 的 影响 。 我 们 可 以 想 出 一 个 含义 是 “不 返回 值 ”的 新 类 型 ， 并 把 
这 个 类 型 与 任何 子 部 件 有 正确 类 型 的 语句 联系 起 来 。 给 这 种 新 类 型 起 名 字 M Type: :VOID: 





回 
| 





class Type 
VOID = new(:void) 
end 





DoNothing 和 Sequence 的 批 ype 实现 很 简单 。DoNothing 的 求 值 总 是 会 成 功 ， 只 要 连接 的 语 
句 没 有 错误 ， 对 sequence 的 求 值 就 会 成 功 : 





class DoNothing 
def type(context) 
Type: :VOID 
end 
end 


class Sequence 
def type(context) 
if first.type(context) == Type::VOID && second.type(context) == Type::VOID 
Type: :VOID 
end 
end 
end 


If 和 While 则 都 含有 能 作为 条 件 的 表达 式 ， 而 且 为 了 让 程序 能 工作 正常 ， 这 个 条 件 必须 求 
值 成 一 个 布尔 值 : 





class If 
def type(context) 
if condition.type(context) == Type::BOOLEAN 8& 
consequence.type(context) == Type::VOID && 
alternative.type(context) == Type::VOID 
Type: :VOID 
end 
end 
end 








在 “玩偶 国 ”中 编程 | 279 





class While 
def type(context) 
if condition.type(context) == Type::BOOLEAN && body.type(context) == Type::VOID 
Type: :VOID 
end 
end 
end 





这 让 我 们 能 区 分 求 值 过 程 中 会 出 错 和 不 会 出 错 的 语句 : 


>> If.new( 
LessThan.new(Number.new(1), Number.new(2)), DoNothing.new, DoNothing.new 
).type({}) 
=> #<Type void> 
>> If.new( 
Add.new(Number.new(1), Number.new(2)), DoNothing.new, DoNothing.new 
).type({}) 
=> nil 
>> While.new(Variable.new(:x), DoNothing.new).type({ x: Type::BOOLEAN }) 
=> #<Type void> 
>> While.new(Variable.new(:x), DoNothing.new).type({ x: Type::NUMBER }) 
=> nil 


a 


Type::VOID 和 nil 在 这 里 有 不 同 的 含义 。 批 ype 返回 Type: :VOID 的 时 候 ， 意 
。 思 是 “这 个 代码 很 好 只 是 疫 设 返 回 值 ”，nil 意思 是 “这 个 代码 含有 错误 。 














唯一 还 没 实现 的 方法 就 是 Assign#type。 我 们 知道 它 应 该 返回 Type: :VOID， 但 在 什么 环 





境 


下 呢 ? 如 何 决 定 一 个 赋值 行为 是 否 良好 呢 ? 想 要 根据 静态 语义 检查 赋值 语句 右 侧 的 表达 式 


是 否 合理 ， 但 关心 它 是 什么 类 型 吗 ? 


这 些 问 题 让 我 们 要 对 什么 应 该 是 有 效 的 Simple 程序 做 出 一 些 设计 决策 。 例 如 ，«x=1; y=2; 
x=X<y” 可 以 吗 ? 根据 动态 语义 它 当 然 没 问题 一 一 在 它 执行 的 时 候 不 会 发 生 什 么 坏事 一 一 








但 我 们 可 能 (或 者 可 能 不 ! ) 对 变量 在 执行 中 从 持 有 一 种 类 型 的 值 转 为 持 有 另 一 种 类 型 
值 感到 不 舒服 。 这 种 灵活 性 可 能 对 一 些 程序 员 有 价值 ， 但 对 其 他 人 则 可 能 是 意外 错误 
来 源 。 














从 设计 静态 语义 的 人 的 角度 来 说 ， 处 理 一 种 变量 类 型 可 以 改变 的 语言 也 更 困难 。 到 目前 
止 我 们 假设 类 型 的 上 下 文 来 自 外 部 并 在 整个 程序 中 不 做 改变 。 但 可 以 选择 一 个 更 复杂 的 
统 ， 这 个 系统 的 上 下 文 在 程序 的 开头 是 空 的 ， 而 上 下 文 随 着 变量 的 声明 和 赋值 逐渐 构建 
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来 。 这 种 方式 与 随 着 程序 的 执行 动态 语义 逐渐 构建 起 值 的 环境 一 样 。 但 这 样 很 复杂 : 如 
语句 能 改变 类 型 上 下 文 ， 那 将 需要 机 ype 方法 既 返 回 一 个 类 型 又 返回 一 个 上 下 文 ， 这 种 
式 与 动态 语义 的 #reduce 方法 返回 一 个 规约 的 程序 和 一 个 环境 一 样 ， 是 为 了 一 个 之 前 的 
名 能 把 一 个 更 新 后 的 上 下 文 传 给 后 面 。 我 们 还 需要 处 理 类 似 «if(b){x=1}else{y=2}» 的 
况 ， 这 里 不 同 的 执行 路 径 会 产生 不 同 的 类 型 上 下 文 ， 还 有 像 «if(b){x=1}else{x=true}» 
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种 情况 ， 这 里 不 同 的 上 下 文 之 间 会 彼此 冲突 。” 


根本 上 说 ， 一 个 类 型 系统 的 限制 性 和 我 们 能 在 其 中 写 的 程序 的 表达 力 之 间 存 在 矛盾 。 一 个 
限制 性 类 型 系统 可 能 是 好 的 ， 因 为 它 保证 排除 了 大 量 可 能 的 错误 ， 但 当 它 阻止 我 们 写 想 要 
写 的 程序 时 它 又 是 坏 的 。 一 个 好 的 类 型 系统 会 在 限制 性 和 表达 力 之 间 找 到 可 接受 的 妥协 方 
式 ， 在 保持 让 程序 员 容 易 理 解 的 同时 排除 足够 的 问题 是 值得 的 。 

通过 坚持 简单 的 思想 就 可 以 解决 这 个 矛盾 : 类 型 上 下 文 由 程序 自身 之 外 的 什么 东西 提供 ， 
而 不 能 被 自身 的 语句 修改 。 这 样 确实 会 排除 某 些 类 型 的 程序 ， 而 且 明 确 回 避 了 类 型 上 下 文 
从 何 而 来 以 及 如 何 得 来 的 问题 ， 但 它 保持 了 静态 语义 的 简单 性 并 且 给 出 了 一 个 容易 遵守 的 
规则 。 


那么 对 于 赋值 语句 ， 我 们 说 表达 式 的 类 型 应 该 与 被 赋值 的 变量 类 型 一 致 























class Assign 
def type(context) 
if context[name] == expression.type(context) 
Type: :VOID 
end 
end 
end 


对 可 以 决定 每 个 变量 的 类 型 并 让 它 保持 不 变 的 所 有 程序 ， 这 个 规则 足够 好 ， 也 是 一 个 可 以 
忍受 的 约束 。 例 如 ， 可 以 检查 在 第 2 章 中 实现 了 静态 语义 的 While 循环 : 
>> statement = 
While.new( 


LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(3))) 





=> «while (x < 5) {x=x+3}» 

>> statement.type({}) 

=> nil 

>> statement.type({ x: Type::NUMBER }) 
=> #<Type void> 

>> statement.type({ x: Type::BOOLEAN }) 
=> nil 


9.2.2 ”好 处 和 限制 

已 经 构建 的 类 型 系统 可 以 避免 基本 的 错误 。 通 过 根据 这 些 静 态 语 句 运 行 一 个 程序 的 玩具 版 
本 ， 可 以 弄 清楚 在 原始 的 程序 中 每 一 个 点 上 可 以 出 现 什么 类 型 的 值 ， 并 检查 这 些 类 型 与 我 
们 运行 它 的 动态 语义 将 要 尝试 做 的 是 否 正 确 匹 配 。 这 个 玩具 版 本 解释 的 简单 性 意味 着 我 们 
只 能 得 到 程序 求 值 时 可 能 发 生 的 事情 的 有 限 信息 ， 但 它 还 意味 着 我 们 很 容易 进行 检查 。 例 
如 ， 可 以 检查 一 个 永远 运行 的 程序 : 








注 5: 一 个 简单 的 解决 办 法 是 : 让 类 型 系统 只 在 它 的 执行 路 径 产 生 同 样 上 下 文 的 时 候 才 接 受 语句 。 
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这 个 程序 确实 很 途 ， 但 它 没 包含 任何 类 型 错误 : 循环 条 件 是 一 个 布尔 值 ， 并 且 变 


>> statement = 
Sequence .new( 
Assign.new(:x, Number.new(0)), 
While.new( 
Boolean.new(true)， 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 
) 
) 
=> «xX = 0; while (true) {x=x+1}» 
>> statement.type({ x: Type::NUMBER }) 
=> #<Type void> 
>> statement.evaluate({}) 
SystemStackError: stack level too deep 





量 x 也 一 





直 用 来 存储 一 个 数 。 当 然 ， 类 型 系统 不 够 聪明 ， 没 能 告诉 我 们 一 个 程序 是 否 在 做 我 们 想 要 
它 干 的 事情 ， 甚 至 是 否 在 做 有 用 的 事情 ， 而 只 告诉 我 们 它 的 各 个 组 成 部 分 是 否 以 正确 的 方 


式 匹 配 了 。 但 因 











为 它 需 要 是 安全 的 (就 像 Sign 抽象 一 样 ) ， 所 以 有 时 候 对 一 个 程序 是 否 含 


有 任何 错误 会 给 出 过 于 悲观 的 答案 。 如 果 用 额外 的 一 个 语句 扩展 上 面 的 程序 ， 我 们 就 能 
出 这 一 点 来 : 


>> statement = Sequence.new(statement, Assign.new(:x, Boolean.new(true))) 


=> «xX = 0; while (true) {x =x+1}; x= true» 
>> statement.type({ x: Type::NUMBER }) 
=> nil 


方法 村 ype 返回 nil 表明 有 错误 ， 因 为 存在 一 个 把 布尔 值 赋 给 x 的 语句 ， 可 是 这 个 语句 永 


远 不 会 执行 ， 所 以 在 运行 时 不 会 实际 引发 一 个 问题 。 我 们 的 类 型 系统 没有 那么 聪 








明 ， 认 识 


不 到 这 一 点 ， 但 它 给 出 了 一 个 安全 的 答案 :“ 这 个 程序 可 能 会 出 错 。” 这 过 于 小 心 但 并 没有 


错误 。 有 时 候 在 程序 中 试图 把 一 个 布尔 值 赋 给 一 个 数字 变量 确实 有 可 能 出 错 ， 但 


原因 ， 它 实际 上 不 会 出 错 。 


并 不 仅仅 是 无 限 循 环 会 引起 问题 。 像 下 面 这 个 程序 的 动态 语义 就 没有 问题 : 





>> statement = 
Sequence .new( 
If.new( 
Variable.new(:b)， 
Assign.new(:x, Number.new(6)), 
Assign.new(:Xx, Boolean.new(true)) 
入 
Sequence .new( 
If.new( 
Variable.new(:b)， 
Assign.new(:y, Variable.new(:x)), 
Assign.new(:y, Number.new(1)) 
)， 


Assign.new(:z, Add.new(Variable.new(:y), Number.new(1))) 








因为 某 种 
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) 
=> «if (b) {x=6}else{x= true}; if (b) {y=x}else{y=1};z=y+1» 
>> statement.evaluate({ b: Boolean.new(true) }) 
=> {:b=>«true», :X=>«6», :y=>«6», :2Z=>«7»} 
>> statement.evaluate({ b: Boolean.new(false) }) 
=> {:b=>«false», :x=>«true», :y=>«1», :2=>«2»} 


变量 x 根据 b 是 true 或 者 false 决定 来 存储 一 个 数字 还 是 一 个 布尔 值 ， 这 在 求 值 过 程 中 从 
来 都 不 是 问题 。 因 为 程序 会 一 致 地 使 用 一 个 或 者 另 一 个 ;没有 可 能 的 执行 路 径 会 让 x 既 被 
处 理 成 一 个 数 又 被 处 理 成 一 个 布尔 值 。 但 静态 语义 使 用 的 抽象 值 没有 足够 的 细 方 ， 不 能 
示 出 这 样 是 可 以 的 “， 因 此 安全 的 近似 总 是 会 说 “这 个 程序 可 能 会 出 错 ”: 








>> statement.type({}) 

=> nil 

>> context = { b: Type::BOOLEAN, y: Type::NUMBER, z: Type::NUMBER } 
=> {:b=>#<Type boolean>, :y=>#<Type number>, :z=>#<Type number>} 

>> statement.type(context) 

=> nil 

>> statement.type(context.merge({ x: Type::NUMBER })) 

=> nil 

>> statement.type(context.merge({ x: Type::BOOLEAN })) 

=> nil 


这 是 一 个 静态 类 型 系统 (static type system)， 为 了 在 运行 前 就 对 程序 进行 检 
QS 4 、 查 而 设计 ， 在 一 个 静态 类 型 语言 中 ， 每 一 个 变量 都 有 相关 的 类 型 。Ruby 的 
"动态 类 型 系统 (dynamic type system) 工作 方式 不 同 : 变量 没有 类 型 ， 而 值 
的 类 型 只 是 在 程序 执行 过 程 中 它们 实际 使 用 时 才 会 检查 。 这 让 Ruby 可 以 处 
理 赋值 给 同一 变量 的 不 同类 型 的 值 ， 代 价 就 是 在 程序 执行 前 不 能 检查 出 类 型 
的 bug 来 。 











这 个 系统 专注 于 编程 中 某 种 特定 方式 的 错误 : 每 一 段 语 法 的 动态 语义 对 其 将 要 处 理 的 值 的 
类 型 是 有 某 种 期 望 的 ， 而 类 型 系统 检查 那些 期 望 ， 以 便 保 证 在 期 望 为 布尔 值 的 时 候 不 要 出 
现 数 字 ， 反 过 来 期 望 为 数字 的 时 候 不 要 出 现 布尔 值 。 但 一 个 程序 还 存在 其 他 的 犯错 方式 ， 
而 这 个 静态 语义 并 不 对 其 进行 检查 。 例 如 ， 这 个 类 型 系统 不 会 注意 到 一 个 变量 在 使 用 之 前 
是 否 已 经 被 实际 赋值 了 ， 因 此 任何 包含 未 初始 化 变量 的 程序 都 能 通过 这 个 类 型 检查 器 ， 但 


























在 求 值 过 程 中 则 会 失败 。 








>> statement = Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 
二 加 赴 氏 .安定 六 

>> statement.type({ x: Type::NUMBER }) 

=> #<Type void> 

>> statement.evaluate({}) 

NoMethodError: undefined method “value' for nil:NilClass 























: 在 这 种 情况 下 ， 细 市 是 x 的 类 型 依赖 于 b 的 值 。 我 们 的 类 型 不 含有 关于 变量 具体 值 的 任何 信息 ， 从 而 











它们 无 法 表达 类 型 和 值 的 依赖 。 
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我 们 从 类 型 系统 得 到 的 任何 信息 都 有 些 可 疑 ， 并且 在 决定 对 其 投入 多 大 的 信任 时 得 注意 它 
的 限制 。 程 序 静 态 语义 的 一 次 成 功 执行 并 不 意味 着 “这 个 程序 将 肯定 起 作用 "， 只 是 表明 
“这 个 程序 在 一 种 特定 的 方式 下 肯定 不 会 报错 ”"。 能 有 一 个 自动 化 的 系统 告诉 我 们 程序 没有 
六 在 的 bug 或 者 错误 当然 很 好 ， 但 就 像 在 第 8 章 看 到 的 那样 ， 世 界 就 是 没 那么 方便 。 


9.3 ”应 用 


本 章 已 经 概括 了 抽象 解释 的 基本 思想 : 使 用 代价 低 的 近似 来 了 解 代价 高 的 计算 ， 并 展示 了 
一 个 简单 类 型 系统 作为 例子 说 明 近 似 对 分 析 程 序 是 很 有 用 的 。 











我 们 对 抽象 解释 的 讨论 非常 不 正式 。 正 式 来 讲 ， 抽 象 解释 是 一 种 数学 化 的 技术 ， 同 样 语言 
的 不 同 语义 通过 函数 连接 到 一 起 ， 这 些 函 数 把 具体 值 的 集合 转换 成 抽象 值 的 集合 ， 反 之 亦 
然 。 这 就 允许 抽象 程序 的 结果 和 性 质 可 以 按照 具体 程序 的 方式 来 理解 。 








这 项 技术 一 个 著名 的 工业 级 应 用 是 Astrée 静态 分 析 器 (http://www.astree.ens/fr/)， 它 使 用 
抽象 解释 自动 证 明 一 个 C 程 序 没有 像 被 零 除 、 数 组 越界 和 整数 溢出 这 样 的 运行 时 错误 。 
Astrée 不 仅 已 经 用 来 验证 为 国际 空间 站 运送 补给 的 儒 勒 " 几 尔 纳 (Jules Verne) ATV-001 
任务 的 自动 对 接 软件 ， 还 被 用 来 验证 空 客 A340 和 A380 飞机 的 飞行 控制 软件 。 抽 象 解释 
通过 提供 安全 的 近似 而 不 是 有 保证 的 答案 来 遵循 Rice 理论 ， 因 此 Astrée 有 可 能 报告 实际 
不 存在 的 运行 时 错误 (错误 警告 ) ; 实际 上 ， 它 的 抽象 在 验证 A340 软件 时 准确 到 足以 避 
免 任 何 错误 的 警告 。 
































用 Simple 语言 写 的 程序 只 能 操纵 基本 的 值 (数字 和 布尔 值 )， 因 此 本 章 的 类 型 都 很 基本 。 
现实 中 的 编程 语言 会 处 理 很 多 种 值 ， 因 此 真实 的 静态 类 型 系统 要 更 复杂 。 例 如 ， 像 ML 和 
Haskell 这 样 的 静态 类 型 函数 式 编程 语言 中 函数 也 是 值 (就 像 Ruby 的 proc) ， 因 此 它们 的 类 
型 系统 支持 总 数 类 型 。 意 思 就 像 “ 带 有 两 个 数字 参数 并 返回 一 个 布尔 值 的 函数 "， 可 以 让 类 
型 检查 器 校 验 到 一 个 函数 调用 中 用 到 的 参数 与 函数 定义 的 参数 匹配 。 














类 型 系统 还 可 以 携带 其 他 信息 : Java 有 一 个 类 型 与 影响 系统 (type and effect system) 不 只 
跟踪 方法 参数 和 返回 值 的 类 型 ， 还 会 跟踪 能 由 方法 体 抛 出 的 受 检 异常 (checked exception， 
抛 出 一 个 异常 是 一 个 影响 )， 用 来 保证 所 有 可 能 的 异常 要 么 被 处 理 掉 要 么 被 传播 出 去 。 











这 是 我 们 计算 理论 之 旅 的 终点 了 。 我 们 设计 了 不 同 能 力 的 语言 和 机 器 ， 从 不 同 寻常 的 系统 
中 梳理 出 计算 ， 然 后 一 头 扎 到 计算 机 编程 的 理论 限制 当中 。 


除了 探索 特定 的 机 器 和 技术 之 外 ， 我 们 还 看 到 了 一 些 更 通用 的 思想 。 


任何 人 都 可 以 设计 和 实现 一 种 编程 语言 。 语 法 和 语义 的 基本 思想 是 简单 的 ，Treetop 这 
样 的 工具 可 以 处 理 枯燥 的 细节 。 

每 一 个 计算 机 程序 都 是 一 个 数学 对 象 。 按 句法 来 说 ， 一 个 程序 只 是 一 个 大 数 ; 语义 上 来 
说 ， 它 可 能 代表 一 个 数学 函数 ， 或 者 一 个 能 被 形式 化 规约 规则 操纵 的 分 层 结构 。 这 意味 
着 数学 上 的 许多 技术 和 成 果 ， 如 Kleene 规约 理论 或 者 G56del 不 完备 定理 ， 都 能 等 价 地 
应 用 到 程序 上 。 

计算 ,最 初 被 描述 为 只 是 “一 台 计 算 机 做 的 事 ”， 已 经 被 证 明 是 某 种 自然 力量 。 很 容易 
把 计算 想象 为 一 个 复杂 的 人 类 发 明 ， 它 只 能 由 对 许多 复杂 部 分 进行 特殊 设计 的 系统 来 执 
行 ， 但 在 系统 中 还 可 以 看 到 支持 它 没 那么 复杂 。 因 此 ， 计 算 不 是 一 个 枯燥 的 只 是 发 生 在 
微 处 理 嚣 中 的 人 工 过 程 ， 而 是 一 个 在 许多 不 同 地 点 以 不 同方 式 发生 的 普遍 现象 。 

计算 不 是 全 有 或 全 无 的 。 不 同 的 机 器 拥有 不 同 的 计算 能 力 , 这 给 了 我 们 用 途上 的 连续 性 : 
DFA 和 NFA 有 有 限 的 能 力 ，DPDA 更 强大 ，NPDA 还 更 强大 ， 而 图 灵机 是 我 们 知道 的 
最 强大 的 机 器 。 

抽象 的 编码 和 级 别 对 于 利用 计算 能 力 必 不 可 少 。 计 算 机 是 维护 抽象 宝塔 的 机 器 ， 从 非常 
低层 次 的 半导体 物理 学 开始 ， 上 升 到 层次 高 得 多 的 多 点 触 控 图 形 用 户 界面 。 为 了 让 计算 
有 用 ， 我 们 需要 能 把 现实 世界 中 复杂 的 思想 编码 成 机 器 能 处 理 的 更 简单 的 形式 ， 然 后 再 
把 结果 解码 回 有 意义 的 高 层 表 示 。 
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。 计算 能 做 的 事情 是 有 限制 的 。 我 们 不 知道 如 何 构建 比 图 灵机 能 力 更 强 的 机 器 ， 但 确实 存 
在 图 灵机 无 法 解决 的 问题 ， 而 这 些 问题 包括 发 现 我 们 所 写 程序 的 信息 。 可 以 利用 模糊 的 
或 者 不 完整 的 答案 处 理 这 些 限 制 ， 以 便 质 疑 我 们 程序 的 行为 。 


想 可 能 不 会 立即 改变 你 工作 的 方式 ， 但 我 希望 它们 已 经 满足 了 你 的 某 种 好 奇 心 ， 并 
你 享受 在 叶 汕 申 央 现 计算 时 所 度 过 的 时 
































亚马逊 读者 评论 


“Tom 讲 解 关键 概念 的 方式 出 人 意料 ， 
详 略 得 当 ， 一 语 中 的 。 当 年 我 上 大 学 时 
经 常 纠结 于 这 些 概念 …… 当 初 若 有 这 本 
书 ， 该 有 多 好 啊 ! ” 


“虽然 本 书 讲述 了 深刻 的 计算 理论 ， 但 
我 却 觉得 这 是 一 次 愉悦 的 阅读 之 旅 。 书 
中 短小 精 悍 的 Ruby 示 例 让 我 惊喜 连连 。 
本 书 确实 技术 性 很 强 ， 但 恰到好处 的 示 
例 让 我 们 很 容易 理解 各 种 概念 ， 其 系统 
的 梳理 和 讲解 绝对 会 让 你 不 虚 此 


一 


» 
{Ts 


“我 刚刚 读 完 前 三 章 的 内 容 ， 就 已 了 解 
如 何 用 一 种 编程 语言 实现 另 一 种 编程 语 
言 了 ! 当然 ， 我 还 学 到 了 一 些 Ruby 知 
识 。 本 书 内 容 详 略 得 当 、 易 于 理解 。 
Tom 把 原本 枯燥 的 主题 讲解 得 妙趣 横 
生 ， 同 时 又 极 具 启发 性 。” 
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计算 的 本 质 深 入 剖析 程序 和 计算 机 


我 知道 你 是 一 位 编程 高 手 ， 写 代码 对 你 而 言 是 手 到 擒 来 的 事 。 但 
是 ， 你 确定 自己 多 年 练 就 的 编程 技能 不 是 建立 在 某 种 想当然 的 假 
设 基 础 上 ? 确定 自己 不 是 每 天 都 在 “稀里糊涂 ”地 写 代码 ?确定 
真正 理解 自己 的 代码 是 如 何 运行 的 吗 ? 

如 采 你 想像 “大 牛 ” 级 的 程序 员 一 样 做 开发 ， 或 者 想 摆脱 自己 半 
路 出 家 的 知识 “ 回 ” 境 ， 本 书 能 够 为 你 真正 讲 明白 计算 理论 和 编 
程 语言 的 工作 原理 与 真切 含义 。 本 书 使 用 简单 的 Ruby 代 码 做 示 
例 ， 没 有 枯燥 难 记 的 数学 符号 。 作 者 极力 推崇 循序 渐进 和 从 实践 
中 学 习 ， 他 从 机 器 、 语 言 讲 到 程序 ， 又 一 路 从 最 简单 的 机 器 (有 
限 自动 机 ) 过 渡 到 复杂 的 机 器 (图 灵机 ) ， 从 设计 实现 简单 的 编 
程 语言 到 极 简 的 机 器 ， 而 后 又 推理 所 谓 “ 不 可 能 ”解决 的 问题 ， 
为 读者 完美 打造 了 轻松 有 趣 的 阅读 体验 。 


目 计算 的 基本 概念 ， 如 语言 中 的 图 灵 完 备 性 
曙 程序 如 何 使 用 动态 语义 与 机 器 交流 思想 
息 有 限 自动 机 的 功能 

目 通用 图 灵机 如 何 众生 了 今天 的 通用 计算 机 
目 使 用 简单 语言 和 细胞 自动 机 执行 复杂 计算 
日 哪些 语言 特性 对 计算 而 言 是 必 不 可 少 的 
曙 停机 和 自 引用 为 何 会 让 计算 问题 无 解 

日 用 抽象 解释 和 类 型 系统 分 析 程 序 
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如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com ， 会 有 编辑 或 作 译 者 协助 
答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 
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